摘要
农业问句文本数据具有专业名词多、特征稀疏、语句规范性差等特征,难以深入挖掘句间交互关系.为改善农业相似问句的匹配性能,提出一种基于特征增强的多方位农业问句语义匹配模型.模型通过共享参数的双向长短期记忆网络提取上下文向量,分别引入自注意力机制、多维注意力机制增强农业问句文本语义推断特征和文本距离特征,通过多特征增强聚焦语义特征信息,将增强特征嵌入到多方位匹配函数中,从向量值、方向和元素等角度进行句间相似度对比,以捕获句子多样性特征.从农业问答社区导出农业问答文本数据,人工标注相似问句构建试验数据集.试验结果表明:基于特征增强的多方位农业问句语义匹配模型可以增强文本特征之间的交互,获取更多的关系特征信息,在构建的农业问句数据集上正确率及F1 值达 95.3%和 97.3%,与其他 5 种问句语义匹配模型相比,效果提升明显.
基金项目
科技创新2030"新一代人工智能"重大项目(2021ZD0113605)
国家重点研发计划(2019YFD1101105)
国家重点研发计划(2020YFD1100602)