首页|基于知识图谱、TF-IDF和BERT模型的冬奥知识问答系统

基于知识图谱、TF-IDF和BERT模型的冬奥知识问答系统

扫码查看
传统信息检索技术已经不能满足人们对信息获取效率的要求,智能问答系统应运而生,并成为自然语言处理领域一个非常重要的研究热点.本文针对中文的冬奥问答领域,提出了基于知识图谱、词频-逆文本频率指数(term frequency-inverse document frequency,TF-IDF)和自注意力机制的双向编码表示(bidirectional encoder representation from transformers,BERT)的3种冬奥问答系统模型.本文首次构建了冬奥问答数据集,并将上述3种方法集成在一起,应用于冬奥问答领域,用户可以使用本系统来快速准确地获取冬奥内容相关的问答知识.进一步,对3种模型的效果进行了测评,测量了3种模型各自的回答可接受率.实验结果显示BERT模型的整体效果略优于知识图谱和TDIDF模型,BERT模型对3类问题的回答可接受率都超过了96%,知识图谱和TDIDF模型对于复合统计问答对的回答效果不如BERT模型.
Winter Olympic Q & A system based on knowledge map, TF-IDF and BERT model

罗玲、李硕凯、何清、杨骋骐、王宇洋恒、陈天宇

展开 >

中国科学院计算技术研究所 智能信息处理重点实验室,北京 100190

中国科学院大学,北京 100049

智能问答 冬奥问答 对话模型 知识图谱 TF-IDF BERT

2017YFB1002104

2021

智能系统学报
中国人工智能学会 哈尔滨工程大学

智能系统学报

CSTPCDCSCD北大核心
影响因子:0.672
ISSN:1673-4785
年,卷(期):2021.16(4)
  • 6
  • 15