计算机时代2023,Issue(2) :92-97.DOI:10.16644/j.cnki.cn33-1094/tp.2023.02.021

基于LEBERT-BCF的电子病历实体识别

Entity recognition of electronic medical records based on LEBERT-BCF

吴广硕 樊重俊 陶国庆 贺远珍
计算机时代2023,Issue(2) :92-97.DOI:10.16644/j.cnki.cn33-1094/tp.2023.02.021

基于LEBERT-BCF的电子病历实体识别

Entity recognition of electronic medical records based on LEBERT-BCF

吴广硕 1樊重俊 1陶国庆 1贺远珍1
扫码查看

作者信息

  • 1. 上海理工大学管理学院,上海 200093
  • 折叠

摘要

针对BERT在中文电子病历实体识别过程中缺少词信息,实体边界信息被浪费和模型鲁棒性较差等问题,提出一种基于BERT并引入外部词典进行特征增强和对抗训练的实体识别模型LEBERT-BCF.该模型通过外部词典自动为电子病历进行词汇匹配构建字符-词语对,在BERT内部将字符-词语对中对应字向量与词向量经过Lexicon Adapter模块进行特征融合并使用FGM提升模型的鲁棒性.在CCKS 2019数据集上的实验结果表明,该模型的F1值比BERT-BiLSTM-CRF提高了3.45%.

关键词

BERT/特征增强/对抗训练/字符-词语对/鲁棒性

引用本文复制引用

基金项目

教育部哲学社会科学研究重大课题攻关项目(20JZD010)

出版年

2023
计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
参考文献量4
段落导航相关论文