首页|基于自注意力机制的中文医疗命名实体识别

基于自注意力机制的中文医疗命名实体识别

扫码查看
运用命名实体识别算法从海量医疗文本中抽取信息,对于构建知识图谱、对话系统等具有重要意义.然而医疗实体间存在嵌套、歧义和专业术语缩写多样性的问题,传统的基于统计的方法对于实体边界的定位存在较大偏差.考虑到医疗文本的复杂性,提出了多层Transformer模型,基于其multi-head和self-attention机制提取医疗文本多个语义空间的特征,结合CNN-BiLSTM-CRF对提取的多维度特征序列做标注.实验使用CCKS任务二开源的病历数据,重点识别身体部位、症状体征、检查检验、疾病、药品五类医疗实体,平均F1值达到94%.
Chinese Medical Named Entity Recognition Based on Self-attention

颜柏杨、吴陈

展开 >

江苏科技大学计算机学院 镇江 212003

Transformer 命名实体识别 自注意力机制 自然语言处理

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(4)
  • 2
  • 1