首页|基于混合深度学习的中文医学实体抽取研究

基于混合深度学习的中文医学实体抽取研究

扫码查看
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节.针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性.[方法/过程]首先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型.[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异.
Research on Extraction of Chinese Medical Entities Based on Hybrid Deep Learning

韩普、顾亮

展开 >

南京邮电大学管理学院 南京210003

江苏省数据工程与知识服务重点实验室 南京210023

混合深度学习 医学实体抽取 BERT 注意力 Highway

国家社会科学基金江苏省研究生科研创新计划

17CTQ022KYCX21_0844

2022

图书情报工作
中国科学院文献情报中心

图书情报工作

CSTPCDCSSCICHSSCD北大核心
影响因子:2.203
ISSN:0252-3116
年,卷(期):2022.66(14)
  • 2
  • 10