中国科学院科技论文预发布平台
依存句法特征的科研命名实体识别算法
A Research Entity Recognition Algorithm Based on Dependency Parsing
余丽 钱力 赵华茗
摘要
[目的/意义] 探索科研命名实体及其关系的识别与抽取,提升其在长句等复杂情况下的识别效果,为进一步的应用提供参考与借鉴。[方法/过程] 以依存句法特征分析为基础,提出一种科研命名实体关系抽取方法,过程包括:①使用Standford Tagger工具对目标文本进行词性标注;②基于标注结果,围绕核心谓词和SAO结构,将目标文本分割为结构规范的语义片段;③通过依存句法分析,找出与核心谓词语义相关的主语和宾语,构成(实体,关系,实体)三元组。[结果/结论] 与Ollie、Reverb等主流算法进行的对比测试表明,该方法可以有效提升科研命名实体识别的准确性。
关键词
依存句法分析/科研命名实体/实体识别/关系抽取Key words
dependency parsing/research entity/entity recognition/relation extraction引用本文复制引用
学科分类
自动化技术、计算机技术(计算技术、计算机技术)