首页|中文领域知识图谱构建系统

中文领域知识图谱构建系统

扫码查看
中文表达的灵活性和知识抽取的低准确度使得构建大规模中文知识图谱面临技术挑战.对于某一特定领域,由于知识的长尾性和实体上下文的稀疏性,自动抽取这些领域的高精度、细粒度知识更为困难.本文提出了一个中文领域知识图谱的构建系统,它采用远程监督的学习框架,在利用基于模板的方法从半结构化数据抽取高精度种子知识基础上,提出了基于Word Embedding的线性映射模型从文本从抽取关系,并采用逻辑推断算法进行知识图谱补全.在演示系统中,本文基于中文维基百科构建了中文娱乐知识图谱以支持语义查询,它包括超过70万个知识元组,准确率达到93.1%.

Fan Yan、樊艳、Wang Chengyu、汪诚愚、He Xiaofeng、何晓丰、Zhou Guomin、周国民

展开 >

Institute for Data Science and Engineering, East China Normal University, Shanghai 200062

华东师范大学数据科学与工程研究院 上海 200062

Zhejiang Police College, Hangzhou 310053

浙江警察学院 杭州 310053

展开 >

中文领域 知识图谱 构建系统 数据抽取 线性映射模型

中国计算机学会

第33届中国数据库学术会议(NDBC2016 )

2016-10-01

深圳

第33届中国数据库学术会议(NDBC2016 )论文集

1-4

2016