基于多头注意力的中文电子病历命名实体识别
NAMED ENTITY RECOGNITION BASED ON MULTI-HEAD ATTENTION IN CHINESE ELECTRONIC MEDICAL RECORDS
肖丹 1杨春明 2张晖 3赵旭剑 3李波3
作者信息
- 1. 西南科技大学计算机科学与技术学院 四川绵阳 621010
- 2. 西南科技大学计算机科学与技术学院 四川绵阳 621010;四川省大数据与智能系统工程技术研究中心 四川绵阳 621010
- 3. 西南科技大学计算机科学与技术学院 四川绵阳 621010;西南科大成都天府新区创新研究院 四川成都 610299
- 折叠
摘要
针对中文电子病历中复杂医疗实体的识别问题,提出一种联合特征与多头注意力相结合的实体识别方法.该方法使用字符、词性和词典组成的联合特征,利用BiLSTM和多头注意力分别提取句子的全局特征和局部特征,利用CRF结合所有特征完成实体标签的预测.实验结果表明,该方法F1值达89.16%,其中治疗和疾病两类实体分别达到94.76%和95.56%.
Abstract
Aimed at the recognition problem of complex medical entities in Chinese electronic medical records(EMRs),an entity recognition method combining joint features and multi-head attention is proposed.This method used the joint feature composed of characters,parts of speech and dictionary,and used BiLSTM and multi-head attention to extract separately the global feature and local feature of the sentence.CRF was used to combine all the features to complete the prediction of the entity labels.Experimental results show that the F1-score of this method reaches 89.16%,among which the two types of entities,treatment and disease,reach 94.76%and 95.56%respectively.
关键词
命名实体识别/中文电子病历/多头注意力/长短期记忆网络/条件随机场Key words
Named entity recognition/Chinese electronic medical records/Multi-head attention/Long short-term memory/Conditional random field引用本文复制引用
基金项目
教育部人文社科基金资助项目(17YJCZH260)
赛尔网络下一代互联网技术创新项目(NGII20180403)
出版年
2024