国家学术搜索
登录
注册
中文
EN
计算机应用研究
2021,
Vol.
38
Issue
(1) :
169-174.
DOI:
10.19734/j.issn.1001-3695.2019.09.0526
基于无向分块加权图的无模式实体识别方法研究
Research on schema-agnostic entity resolution based on undirected block weighted graph
杨宁
卢菁
邵清
刘丛
计算机应用研究
2021,
Vol.
38
Issue
(1) :
169-174.
DOI:
10.19734/j.issn.1001-3695.2019.09.0526
下载
引用
认领
✕
来源:
国家科技期刊平台
NETL
NSTL
维普
万方数据
基于无向分块加权图的无模式实体识别方法研究
Research on schema-agnostic entity resolution based on undirected block weighted graph
杨宁
1
卢菁
1
邵清
1
刘丛
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
上海理工大学光电信息与计算机工程学院,上海200093
折叠
摘要
当前利用分块进行实体识别的方案,忽略分块键权重和分块键的歧义,导致精确度较低.提出一个基于无向加权图的无模式实体识别方法,抽取数据源中的分量,利用分量信息熵和TF-IDF方法组合求取聚类分量,建立统一分块方案.通过聚类分量权重与分块键的关系,赋予每组分块键一定的权重,将该权重与边的共现频次进行相乘加权形成无向分块加权图,最后通过修剪方案进行边的修剪,从而解决了数据多分量及分块键歧义问题,提高了精确度.在七个真实数据集上的实验证明了该方法的有效性和可扩展性.
关键词
实体识别
/
无模式实体
/
分量权重
/
聚类分量
/
无向分块加权图
引用本文
复制引用
基金项目
国家自然科学基金青年基金(61703278)
出版年
2021
计算机应用研究
四川省电子计算机应用研究中心
计算机应用研究
CSTPCD
CSCD
北大核心
影响因子:
0.93
ISSN:
1001-3695
下载
引用
认领
被引量
2
参考文献量
3
段落导航
相关论文
摘要
关键词
引用本文
基金项目
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果