首页期刊导航|中文信息学报
期刊信息/Journal information
中文信息学报
中文信息学报

孙茂松

双月刊

1003-0077

cips@iscas.ac.cn

010-62562916

100190

北京海淀区中关村南四街4号

中文信息学报/Journal Journal of Chinese Information ProcessingCHSSCDCSCD北大核心CSTPCD
查看更多>>本刊于1986年创刊,是经国家科委批准,由中国科学技术协会主管,中国中文信息学会和中国科学院软件研究所合办的学术性刊物,是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平,重点刊登我国中文信息处理基础理论与应用技术研究的学术论文,以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学术动态等。从本刊刊登的文章中可以及时了解我国最新的中文信息处理水平和学术动向。所刊登的文章多数得到了国家或省、部级重大科技项目、攻关项目及自然科学和社会科学基金的资助。
正式出版
收录年代

    基于孪生网络文本语义匹配的多文档摘要

    钟琪王中卿王红玲
    107-116页
    查看更多>>摘要:多文档摘要旨在从一组主题相关的文档集中抽取出最能代表文档集中心内容的句子作为摘要,文本语义匹配则是指学习两个文本单元之间的语义关系,使句子表征具有更加丰富的语义信息.该文提出了一种基于孪生网络文本语义匹配的多文档抽取式摘要方法,该方法将孪生网络和预训练语言模型BERT相结合,构建一个文本语义匹配与文本摘要联合学习模型.该模型运用孪生网络从不同的视角考察任意两个文本单元之间的语义关联,学习文档集中碎片化的信息,进一步对重要信息进行评估,最后结合文本摘要模型选择出更能代表文档集主要内容的句子组织成摘要.实验结果表明,该文所提方法和当前主流的多文档抽取式摘要方法相比,在ROUGE评价指标上有较大提升.

    多文档抽取式摘要语义关系预训练语言模型

    面向知识图谱问答的查询图生成方法

    谈川源贾永辉陈文亮陈跃鹤...
    117-126页
    查看更多>>摘要:该文提出一种新的查询图生成方法用于知识图谱问答系统的问句解析.现有查询图生成工作覆盖的复杂问句类型有限,不能较好地处理答案为关系或涉及关系约束的问句,且未充分考虑路径结果间的组合与运算.因此,该文在查询图生成中应用节点操作的同时引入基于关系的操作,并考虑不同主路径之间的组合情况,显著提升对复杂问句的分析能力.并在此基础上,构建了中文知识图谱问答系统.此外,该文构建一份包含多种复杂类型问句的中文知识图谱问答数据集.该数据集和CCKS2019-CKBQA数据集合并后构成一个新的数据集CCKS2019-Comp,并用来测试本文方法的有效性.实验结果表明,该文方法在CCKS2019-CKBQA和CCKS2019-Comp测试集上平均F1值分别达到73.8%和73.3%.该文的新构建数据和代码已开源①.

    知识图谱问答查询图生成数据构建问答系统

    中国中文信息学会语言与知识计算专业委员会2024年度战略研讨会成功召开

    中国中文信息学会
    126页

    面向干扰项增强的无监督常识问答模型

    李伟黄贤英冯雅茹
    127-135页
    查看更多>>摘要:问题生成是无监督常识问答模型的一个核心子任务,目前的方法主要是根据给定知识生成问题和答案,并为每个问题随机生成多个干扰项,然而这些方法存在干扰项与问题相关性不强且随机性较大的问题.该文提出一种面向干扰项增强的无监督常识问答模型,首先根据知识三元组生成问题和正确答案,再为问题建立对应的问题子图,得到与问题相关的三元组集合,使用注意力机制增强特征并根据问题和正确答案确定干扰项,最后使用生成的数据对模型进行训练.该模型在四个不同类型的测试任务上的结果表明,该模型优于目前的最新方法,证明了该模型的有效性.

    干扰项增强问题子图注意力机制

    基于多粒度融合的图卷积网络会话情感分析

    王佳朱小飞唐顾黄贤英...
    136-145页
    查看更多>>摘要:会话情感分析指对一段会话中的每句话进行情感分类,目前大部分会话情感分析模型不仅忽略了对话中内部信息的相互影响,而且没有考虑到日常对话中存在的隐性背景情感.为了有效解决这些问题,该文提出了一个基于多粒度融合的图卷积神经网络,其主要包括两个模块,即特征提取模块和星图增强的图学习模块.首先,特征提取模块使用预训练语言模型RoBERTa获取会话中语句之间粗粒度的上下文信息,同时结合句法依赖树获取词之间细粒度的句法信息,从而将多粒度特征信息引入到会话情感建模.然后,在星图增强的图学习模块中建模会话的背景情感信息和会话中不同说话者之间的交互信息,从而增强会话情感分析的准确性.实验结果表明,该文提出的模型与其他基线模型相比,其准确性以及度量指标F1值在所有数据集上均有显著提升.

    会话情感分析多粒度融合句法依赖树图卷积网络

    融合文本摘要和情绪感知的抑郁倾向识别

    季浩然林鸿飞杨亮徐博...
    146-154页
    查看更多>>摘要:抑郁症作为世界第四大疾病,严重影响着人们的生理和心理健康.随着互联网的发展,社交媒体的发布内容已经成为研究精神疾病的重要数据源,研究者开始应用 自然语言处理技术自动检测抑郁倾向.现存算法无法充分捕捉到长文本中的关键信息,忽略了对用户情绪状态的时序性建模,进而造成抑郁倾向识别性能不佳.该文提出一种融合文本摘要和情绪感知的抑郁倾向识别模型,首先利用文本摘要算法抽取用户历史文本的全局语义特征,在压缩文本长度的同时保留了与用户真实意图强相关的内容;然后利用词汇增强算法计算句子级的细粒度情绪表示,并结合深度神经网络捕获了用户的情绪变化特征.实验结果表明,该文提出的模型取得了更佳的识别效果,在抑郁倾向识别数据集上将检测结果的正类F1值提升至75.61%.

    抑郁倾向识别自然语言处理文本摘要情绪感知

    基于预训练模型自适应匹配的视觉故事生成算法

    宁铭江爱文崔朝阳刘长红...
    155-166页
    查看更多>>摘要:视觉故事生成任务是为一组图像序列生成具有表现力和连贯性的、能准确描述所涉及视觉内容的语句段落,是当前计算机视觉和自然语言处理交叉领域中一个有趣而又快速发展的多模态研究方向.随着预训练模型在各种下游任务的成功,基于预训练模型的视觉故事生成算法也被广泛研究.但因为数据模态的差异和语义鸿沟的存在,预训练模型在微调学习过程中会产生灾难性遗忘问题.如何协调视觉和语言两种模态数据的预训练模型,是当前多模态预训练模型研究的主要目标之一.该文提出基于预训练模型自适应匹配的视觉故事生成算法,一方面综合挖掘图像流的视觉、关系、序列等多样化互补信息,弥补语义差异;同时,另一方面用适应性损失对图文两种模态数据进行特征对齐,以及对图像流数据进行连续信息对齐,取得了较好的效果.算法在目前已公开的视觉故事生成数据集(VIST)上与近年的先进算法进行实验比较.评测结果表明,该文算法在生成故事的图文相关性、文本多样性、内容逻辑连贯性等指标上取得了具有竞争力的结果.

    视觉故事适应匹配损失预训练模型多模态特征图像序列

    修辞可控的中国古典诗歌生成

    杨媛婷朱泓禹马安香刘玉豪...
    167-174页
    查看更多>>摘要:中国古典诗歌是一种语言凝练、语义丰富的文学艺术,它的创作因素有许多方面,修辞手法是其中一个最显著的特征之一,诗人在进行创作时通常会使用修辞手法来增强诗歌的感染力和表现力.该文致力于构建具有修辞手法创作能力的诗歌生成模型,以此来提升生成诗歌的多样性、趣味性和新颖性,从而增加读者阅读过程中的审美体验.该文首先通过人工标注、词句特征提取、训练基于BERT的修辞分类器的方式构建一个修辞诗句数据库,然后将每首诗按照一定的方式序列化成一个长句子,并以此来训练语言模型得到诗歌生成模型.自动评测和人工评测结果表明,模型可以生成具有特定修辞手法的诗歌,且生成诗歌的质量相比基线有显著提升.

    中国古典诗歌诗歌生成修辞可控