首页|基于中文知识图谱的人物实体识别

基于中文知识图谱的人物实体识别

扫码查看
分类是知识图谱构建中的一个重要问题,但是目前多数中文百科都采用人工编辑的方式为词条添加分类,耗费人力并且存在漏标和标错等问题.为此,提出一种自动识别百度百科人物领域下全部实体并添加分类的方法.对百度百科词条已有的分类、属性和副标题进行实体集拓展,使用马尔科夫逻辑网络方法联合推断词条的分类.实验结果表明,与支持向量机和逻辑回归算法相比,该方法在实体识别的精确度和召回率方面性能均有所提升.
People Entity Recognition Based on Chinese Knowledge Graph
Classification is an important issue in constructing knowledge graph.However,the existing categories are edited by human beings for Chinese Baike websites,leading to increasing manpower cost and lost or error of categories.Aiming at this problem,this paper proposes a method to recognize all entities of Baidu Baike.under people domain automatically and add categories for these entities.Entity Set Expansion(ESE) is used for existing raw data of like categories,attributes and subtitles,and Markov Logic Network(MLN) is used to jointly inference the category of entities.Experimental result shows that,compared with Support Vector Machine(SVM) and Logistic Regression(LR) algorithm,the proposed method performs much better both in precision and recall aspects.

entity classificationEntity Set Expansion(ESE)Markov Logic Network(MLN)knowledge graphmachine learningjoint inference

李薇、肖仰华、汪卫

展开 >

复旦大学 计算机科学技术学院,上海 201203

实体分类 实体集拓展 马尔科夫逻辑网络 知识图谱 机器学习 联合推断

国家自然科学基金国家"973"计划项目上海市科技创新行动计划基础研究项目上海市青年科技启明星计划项目

614720852015CB35880015JC140090013dz2260200

2017

计算机工程
华东计算技术研究所 上海市计算机学会

计算机工程

CSTPCDCSCD北大核心
影响因子:0.581
ISSN:1000-3428
年,卷(期):2017.43(3)
  • 7
  • 8