首页|基于实体识别和信息融合的知识图谱研究——以新冠肺炎疫情为例

基于实体识别和信息融合的知识图谱研究——以新冠肺炎疫情为例

扫码查看
突发公共卫生事件通常会造成巨大的破坏,研究时效性与可理解性在解决这类事件中尤为重要,亟需快速分析研究现状、抽取特定研究信息的方法.科学文献是知识传播的主要载体与重要途径之一,针对文献中专业术语特殊性与歧义性导致的传播受阻问题,该文通过自然语言处理与知识图谱技术,以新冠疫情研究相关文献为例,结合实体识别与信息融合构建知识图谱.该方法首先通过对文献的题目与摘要标注实体以构建数据集用于训练BERT-BiLSTM-CRF模型,该模型可以对文本中的医学实体自动识别并提取.然后根据作者信息的多源交叉验证与领域、机构相似度消除作者姓名歧义并构建一个作者集合.最后根据实体-实体、作者-作者和实体-作者关系,在融合多源信息后增量构建新冠肺炎疫情知识图谱.命名实体识别模型在6类不同医学实体上的平均F1分数达到92.86%,知识图谱包含了34802个医学实体与397163名作者.这项研究表明以上流程可以有效地构建知识图谱,并据此快速找到前沿研究热点和相关领域核心学者,有效促进知识的获取和概念的传播.
Knowledge Graph Based on Entity Recognition and Information Fusion —A Case Study of COVID-19

刘华玲、孙毅

展开 >

上海对外经贸大学 统计与信息学院,上海 201620

命名实体识别 实体消歧 BERT 知识图谱 新冠肺炎疫情 可视化分析

2018BJB02316ZDA055

2022

计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
年,卷(期):2022.32(9)
  • 10