江苏科技大学学报(自然科学版)2023,Vol.37Issue(2) :47-52.DOI:10.20061/j.issn.1673-4807.2023.02.009

基于RoBERTa与字词融合的电子病历命名实体识别方法研究

Research on named entity recognition method of electronic medical record based on RoBERTa and word fusion

王卫东 张志峰 徐金慧 杨习贝
江苏科技大学学报(自然科学版)2023,Vol.37Issue(2) :47-52.DOI:10.20061/j.issn.1673-4807.2023.02.009

基于RoBERTa与字词融合的电子病历命名实体识别方法研究

Research on named entity recognition method of electronic medical record based on RoBERTa and word fusion

王卫东 1张志峰 1徐金慧 1杨习贝1
扫码查看

作者信息

  • 1. 江苏科技大学计算机学院,镇江 212100
  • 折叠

摘要

为了提高所抽取电子病历文本中语义信息的准确性,提出基于RoBERTa与字词融合的电子病历命名实体识别算法.采用预训练模型RoBERTa得到充分考虑上下文信息的字向量;然后对文本进行分词处理,再通过Word2Vec得到词向量;最后将两者进行融合传入双向长短记忆神经网络BiLSTM中进行训练,经过条件随机场CRF进行预测输出.在电子病历数据集上进行的对比实验表明,在采用3个评价指标的情况下,文中算法均明显优于经典的电子病历命名实体识别方法.

关键词

电子病历命名实体识别/预训练模型RoBERTa/双向长短记忆神经网络/条件随机场/字词融合

引用本文复制引用

基金项目

国家自然科学基金(51609110)

国家自然科学基金(51779110)

江苏省自然科学基金(BK20191461)

江苏省六大人才高峰资助项目(KTHY-064)

出版年

2023
江苏科技大学学报(自然科学版)
江苏科技大学

江苏科技大学学报(自然科学版)

影响因子:0.373
ISSN:1673-4807
被引量1
参考文献量3
段落导航相关论文