首页|基于多头注意力的中文电子病历命名实体识别

基于多头注意力的中文电子病历命名实体识别

扫码查看
针对中文电子病历中复杂医疗实体的识别问题,提出一种联合特征与多头注意力相结合的实体识别方法.该方法使用字符、词性和词典组成的联合特征,利用BiLSTM和多头注意力分别提取句子的全局特征和局部特征,利用CRF结合所有特征完成实体标签的预测.实验结果表明,该方法F1值达89.16%,其中治疗和疾病两类实体分别达到94.76%和95.56%.
NAMED ENTITY RECOGNITION BASED ON MULTI-HEAD ATTENTION IN CHINESE ELECTRONIC MEDICAL RECORDS
Aimed at the recognition problem of complex medical entities in Chinese electronic medical records(EMRs),an entity recognition method combining joint features and multi-head attention is proposed.This method used the joint feature composed of characters,parts of speech and dictionary,and used BiLSTM and multi-head attention to extract separately the global feature and local feature of the sentence.CRF was used to combine all the features to complete the prediction of the entity labels.Experimental results show that the F1-score of this method reaches 89.16%,among which the two types of entities,treatment and disease,reach 94.76%and 95.56%respectively.

Named entity recognitionChinese electronic medical recordsMulti-head attentionLong short-term memoryConditional random field

肖丹、杨春明、张晖、赵旭剑、李波

展开 >

西南科技大学计算机科学与技术学院 四川绵阳 621010

四川省大数据与智能系统工程技术研究中心 四川绵阳 621010

西南科大成都天府新区创新研究院 四川成都 610299

命名实体识别 中文电子病历 多头注意力 长短期记忆网络 条件随机场

教育部人文社科基金资助项目赛尔网络下一代互联网技术创新项目

17YJCZH260NGII20180403

2024

计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
年,卷(期):2024.41(1)
  • 3