首页期刊导航|中文信息学报
期刊信息/Journal information
中文信息学报
中文信息学报

孙茂松

双月刊

1003-0077

cips@iscas.ac.cn

010-62562916

100190

北京海淀区中关村南四街4号

中文信息学报/Journal Journal of Chinese Information ProcessingCHSSCDCSCD北大核心CSTPCD
查看更多>>本刊于1986年创刊,是经国家科委批准,由中国科学技术协会主管,中国中文信息学会和中国科学院软件研究所合办的学术性刊物,是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平,重点刊登我国中文信息处理基础理论与应用技术研究的学术论文,以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学术动态等。从本刊刊登的文章中可以及时了解我国最新的中文信息处理水平和学术动向。所刊登的文章多数得到了国家或省、部级重大科技项目、攻关项目及自然科学和社会科学基金的资助。
正式出版
收录年代

    基于正反上下文语义对齐融合的多模态文本摘要模型

    陈中峰陆振宇荣欢
    108-119页
    查看更多>>摘要:该文基于序列到序列的神经网络,提出了使用文本语义信息和图片语义信息对多模态文本摘要生成任务进行建模.具体而言,使用文本一级编码器和带有图片信息指导的二级门控编码器对多模态语义信息进行编码,对齐文本与图片的语义信息.通过多模态正向注意力机制与反向注意力机制多方面观察对齐后的源文本与图片内容,分别得到各自模态语义信息的正相关和不相关特征表示.使用正向滤波器过滤正向注意力机制中的不相关信息,使用反向滤波器过滤反向注意力机制中的相关信息,达到分别从正向与反向两个方面选择性地融合文本语义信息和图片语义信息的目的.最后基于指针生成网络,使用正相关信息搭建正向指针、使用不相关信息搭建反向指针,生成带有多模态语义信息补偿的文本摘要内容.在京东中文电子商务数据集上,所提模型生成的多模态文本摘要在 ROUGE-1、ROUGE-2、ROUGE-L指标上分别取得了 38.40、16.71、28.01 的结果.

    多模态文本摘要多模态信息对齐二级门控编码机制文本生成模型

    融合Emoji情感分布的多标签情绪识别方法

    刘烨刘仕鑫曾雪强左家莉...
    120-133页
    查看更多>>摘要:随着基于互联网的社交媒体兴起,Emoji由于具有以图形化方式快速准确地表达情绪的特点,目前已经成为用户在日常交流中广泛使用的图像文本.已有研究工作表明,在基于文本的情绪识别模型中考虑 Emoj i 信息,对于提升模型性能具有重要的作用.目前,考虑 Emoj i 信息的情绪识别模型大多采用词嵌入模型学习 Emoj i 表示,得到的 Emoj i向量缺乏与目标情绪的直接关联,Emoji表示蕴含的情绪识别信息较少.针对上述问题,该文通过软标签为 Emoj i构建与目标情绪直接关联的情感分布向量,并将 Emoj i情感分布信息与基于预训练模型的文本语义信息相结合,提出融合Emoj i情感分布的多标签情绪识别方法(Emoji Emotion Distribution Information Fusion for Multi-label Emotion Recognition,EIFER).EIFER方法在经典的二元交叉熵损失函数的基础上,通过引入标签相关感知损失对情绪标签间存在的相关性进行建模,以提升模型的多标签情绪识别性能.EIFER方法的模型结构由语义信息模块、Emoji信息模块和多损失函数预测模块组成,采用端到端的方式对模型进行训练.在 SemEval2018 英文数据集上的情绪预测对比实验结果表明,该文提出的EIFER方法比已有的情绪识别方法具有更优的性能.

    Emoji情感分布多标签分类情绪识别情绪相关性

    基于知识蒸馏的跨模态语音情感分类

    尤佩雯王晶晶高晓雅李寿山...
    134-142页
    查看更多>>摘要:针对语音情感分类任务面临的语音数据标注困难的挑战,该文提出了一种新的跨模态语音情感分类任务,其可以使用文本模态数据(源端)帮助语音模态数据(目标端)进行情感分类.在此基础上,提出了一种基于知识蒸馏的跨模态情感分类模型,旨在通过知识蒸馏方法将文本情感分类模型(教师模型)学习到的预训练先验知识蒸馏到语音情感分类模型(学生模型)中.该模型的特色在于无须在测试端依赖昂贵的语音识别技术,可对原始语音数据直接进行情感分类,有利于该模型在实际语音情感分类应用场景中大规模落地.实验结果表明,该文所提出的方法可以有效利用文本模态分类的经验来提升语音模态的分类效果.

    跨模态知识蒸馏情感分类

    融合学科知识的数学习题知识点自动标注模型

    罗文兵罗凯威黄琪王明文...
    143-155页
    查看更多>>摘要:习题知识点标注是构建结构化题库和实现个性化学习的关键任务.对于数学习题,由于其存在公式化、表达精炼化等特殊性,现有的标注模型无法很好地捕获关键信息,进而难以深入理解文本中蕴含的深层语义.此外,结合领域知识的知识点标注模型普遍存在引入的知识不够关键、融合的方式过于直接的问题,缺乏对信息的有效筛选,从而导致在特征融合时产生大量噪声,干扰模型最终的标注结果.为此,该文提出了一种融合学科知识的数学习题知识点自动标注模型 MKAGated.该模型首先利用预训练模型对原始习题和两种细化的学科知识文本进行初步的语义编码表示,然后利用注意力机制实现习题与两种学科知识的信息交互以获取两种学科知识的深层语义表征,最后通过门控机制连续地、隐式地融合两种深层语义表征的平均池化表示以保留原始习题表示中有利于最终分类的语义特征.模型在自建的初中数学习题知识点标注数据集上测试的三种指标 micro-F1、macro-F1、weighted-F1 相较于基准模型分别提升了 1.99%、2.99%、2.12%,实验结果表明,该文所提方法能有效提升数学习题知识点的标注.

    知识点标注学科知识注意力机制门控机制

    基于改进Conformer的新闻领域端到端语音识别

    张济民早克热·卡德尔艾山·吾买尔申云飞...
    156-164页
    查看更多>>摘要:目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集 CH_NEWS_ASR,并使用 ESPNET-0.9.6 框架的 RNN、Transformer和Conformer等模型对数据集的有效性进行了验证,实验表明,该文所构建的语料在最好的模型上CER为 4.8%,SER为 39.4%.由于新闻联播主持人说话语速相对较快,该文构建的数据集文本平均长度为 28 个字符,是 Aishell_1 数据集文本平均长度的 2 倍;且以往的研究中训练目标函数通常为基于字或词水平,缺乏明确的句子水平关系,因此该文提出了一个句子层级的一致性模块,与Conformer模型结合,直接减少源语音和目标文本的表示差异,在开源的 Aishell_1 数据集上其 CER 降低 0.4%,SER 降低 2%;在 CH_NEWS_ASR 数据集上其CER降低 0.9%,SER降低 3%,实验结果表明,该方法在不增加模型参数量的前提下能有效提升语音识别的质量.

    端到端语音识别Conformer句子层级一致性