计算机应用研究2021,Vol.38Issue(7) :2025-2031.DOI:10.19734/j.issn.1001-3695.2020.09.0238

结合CRF的边界组合生物医学命名实体识别

CRF-combined boundary assembly method for biomedical named entity recognition

扈应 陈艳平 黄瑞章 秦永彬
计算机应用研究2021,Vol.38Issue(7) :2025-2031.DOI:10.19734/j.issn.1001-3695.2020.09.0238

结合CRF的边界组合生物医学命名实体识别

CRF-combined boundary assembly method for biomedical named entity recognition

扈应 1陈艳平 2黄瑞章 2秦永彬2
扫码查看

作者信息

  • 1. 贵州大学 计算机科学与技术学院,贵阳550025
  • 2. 贵州大学 计算机科学与技术学院,贵阳550025;贵州大学 贵州省公共大数据重点实验室,贵阳550025
  • 折叠

摘要

许多的生物医学命名实体识别(Bio-NER)工作都集中于提取扁平化的实体,而忽略了嵌套实体和不连续实体.此外,大多数生物医学命名实体都未遵循统一的命名法,具有许多典型的领域特征,但其使用效率较低.为此提出一种结合CRF的边界组合命名实体识别方法,有效地利用了生物医学实体特征.该方法包括边界检测、边界组合和实体筛选三个步骤.首先使用神经网络模型和基于特征的CRF模型识别实体开始和结束边界,然后经过边界组合产生候选实体,最后使用多输入的卷积神经网络模型对候选实体进行筛选并分类.实验表明,该方法能够有效地识别生物医学文献中的嵌套和不连续实体,在GENIA数据集上达到81.89%的F值.

关键词

生物医学命名实体识别/深度学习/条件随机场/信息抽取

引用本文复制引用

基金项目

国家自然科学基金通用联合基金重点项目(U1836205)

国家自然科学基金重大研究计划项目(91746116)

国家自然科学基金(62066007)

国家自然科学基金(62066008)

贵州省科技重大专项计划项目(黔科合重大专项字[2017]3002)

贵州省科学技术基金重点项目(黔科合基础[2020]1Z055)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量5
参考文献量4
段落导航相关论文