中华医学图书情报杂志2022,Vol.31Issue(3) :40-47.DOI:10.3969/j.issn.1671-3982.2022.03.005

融合多维特征的医学知识图谱分步实体对齐方法

A hierarchical entity alignment method for medical knowledge graph based on multi-dimensional features

娄培 胡佳慧 赵琬清 陈凌云 方安
中华医学图书情报杂志2022,Vol.31Issue(3) :40-47.DOI:10.3969/j.issn.1671-3982.2022.03.005

融合多维特征的医学知识图谱分步实体对齐方法

A hierarchical entity alignment method for medical knowledge graph based on multi-dimensional features

娄培 1胡佳慧 1赵琬清 1陈凌云 1方安1
扫码查看

作者信息

  • 1. 中国医学科学院医学信息研究所,北京 100020
  • 折叠

摘要

目的:提出一种融合多维特征的医学知识图谱分步实体对齐方法,从电子病历和网络资源中抽取垂体瘤相关疾病、症状数据,进行实证研究.方法:首先进行尾实体对齐,通过训练Word2Vec和BERT模型获得实体的语义特征,使用三元组训练翻译模型得到实体结构特征,利用Jaccard相似度计算字符特征,利用分类模型进行特征学习和预测;然后进行头实体对齐,利用实体的属性相似性和结构相似性构建头实体对齐模型.结果:尾实体对齐模型的F1值为99.58%,头实体对齐模型的F1值为97.32%,说明所选择的特征可以很好地表示实体,模型具有良好的对齐效果.结论:目前关于医学知识图谱的实体对齐模型研究仍处于起步阶段,融合多维特征的医学知识图谱分步实体对齐方法是对现有医学知识图谱构建方法的重要补充.

关键词

知识图谱/实体对齐/相似度计算/表示学习/词嵌入

引用本文复制引用

基金项目

科技创新2030"新一代人工智能"重大项目(2019AAA0104902)

国家社会科学基金(21CTQ016)

中国医学科学院医学与健康科技创新工程项目(2021-I2M-1-056)

出版年

2022
中华医学图书情报杂志
解放军医学图书馆

中华医学图书情报杂志

影响因子:1.247
ISSN:1671-3982
参考文献量8
段落导航相关论文