计算机技术与发展2020,Vol.30Issue(10) :97-100,186.DOI:10.3969/j.issn.1673-629X.2020.10.018

基于字向量和增强表示BiLSTM句子相似度研究

Research on Sentence Similarity Based on Character Vector and Enhanced Representation BiLSTM

贾畅 叶飞 刘帅君 麻之润
计算机技术与发展2020,Vol.30Issue(10) :97-100,186.DOI:10.3969/j.issn.1673-629X.2020.10.018

基于字向量和增强表示BiLSTM句子相似度研究

Research on Sentence Similarity Based on Character Vector and Enhanced Representation BiLSTM

贾畅 1叶飞 1刘帅君 1麻之润1
扫码查看

作者信息

  • 1. 云南农业大学 大数据学院,云南 昆明 650201
  • 折叠

摘要

目前分词工具在金融领域智能客服中无法对金融相关词汇进行有效切分,且基于单词的模型更容易受到数据稀疏性和词汇表外单词的影响.针对该问题,提出一种基于字向量和增强表示BiLSTM的句子相似度计算模型—EBiLSTM.该模型首先通过双向长短时记忆网络BiLSTM提取由字嵌入组成的句子的字特征及其上下文表示,然后计算句子对中一个句子与另一个句子的软对齐表示,在此基础上通过句子表示与其对齐表示间的交互来增强最终的句子表示.所提模型可以有效学习到句子对的语义关系,加入增强表示层后通过两个句子的交互可以更好地捕捉两个句子间的语义差异.实验表明,所提模型在真实数据集上,精确率、召回率和F1值均优于基于词向量的CNN和BiLSTM方法,也优于基于字向量的CNN和BiLSTM方法.

关键词

智能客服/句子相似度/循环神经网络/字向量/句子对齐

引用本文复制引用

基金项目

云南省重大科技专项(2018ZI001-2)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量2
参考文献量2
段落导航相关论文