计算机应用研究2021,Vol.38Issue(1) :169-174.DOI:10.19734/j.issn.1001-3695.2019.09.0526

基于无向分块加权图的无模式实体识别方法研究

Research on schema-agnostic entity resolution based on undirected block weighted graph

杨宁 卢菁 邵清 刘丛
计算机应用研究2021,Vol.38Issue(1) :169-174.DOI:10.19734/j.issn.1001-3695.2019.09.0526

基于无向分块加权图的无模式实体识别方法研究

Research on schema-agnostic entity resolution based on undirected block weighted graph

杨宁 1卢菁 1邵清 1刘丛1
扫码查看

作者信息

  • 1. 上海理工大学光电信息与计算机工程学院,上海200093
  • 折叠

摘要

当前利用分块进行实体识别的方案,忽略分块键权重和分块键的歧义,导致精确度较低.提出一个基于无向加权图的无模式实体识别方法,抽取数据源中的分量,利用分量信息熵和TF-IDF方法组合求取聚类分量,建立统一分块方案.通过聚类分量权重与分块键的关系,赋予每组分块键一定的权重,将该权重与边的共现频次进行相乘加权形成无向分块加权图,最后通过修剪方案进行边的修剪,从而解决了数据多分量及分块键歧义问题,提高了精确度.在七个真实数据集上的实验证明了该方法的有效性和可扩展性.

关键词

实体识别/无模式实体/分量权重/聚类分量/无向分块加权图

引用本文复制引用

基金项目

国家自然科学基金青年基金(61703278)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量2
参考文献量3
段落导航相关论文