山东通信技术2024,Vol.44Issue(3) :27-30.

基于抽取式机器阅读理解的多文件汇编问答技术研究

秦春凯 冯延钊 陈瑞恒 刘珊 徐畅
山东通信技术2024,Vol.44Issue(3) :27-30.

基于抽取式机器阅读理解的多文件汇编问答技术研究

秦春凯 1冯延钊 1陈瑞恒 2刘珊 2徐畅1
扫码查看

作者信息

  • 1. 中国移动山东公司中移齐鲁创新院分公司,山东济南 250001
  • 2. 中国移动山东公司,山东济南 250001
  • 折叠

摘要

研究一种基于抽取式机器阅读理解的多文件汇编问答技术,解决当前多文件问答系统中存在的生成答案可信度不足、处理文件能力有限、计算复杂度高等问题.通过滑动窗口切分保留文本块上下文信息,采用BM25算法计算特征向量并持久化存储于分布式数据库,结合抽取式机器阅读理解模型进行问答.实验结果表明,该方法显著提高了问答的准确率,多文件汇编问答技术为高效、准确的信息检索与问答提供了新途径.

关键词

多文件/汇编问答/抽取式机器阅读理解

引用本文复制引用

出版年

2024
山东通信技术
山东通信学会

山东通信技术

影响因子:0.14
ISSN:
段落导航相关论文