国家学术搜索
登录
注册
中文
EN
江苏科技大学学报(自然科学版)
2023,
Vol.
37
Issue
(2) :
47-52.
DOI:
10.20061/j.issn.1673-4807.2023.02.009
基于RoBERTa与字词融合的电子病历命名实体识别方法研究
Research on named entity recognition method of electronic medical record based on RoBERTa and word fusion
王卫东
张志峰
徐金慧
杨习贝
江苏科技大学学报(自然科学版)
2023,
Vol.
37
Issue
(2) :
47-52.
DOI:
10.20061/j.issn.1673-4807.2023.02.009
引用
认领
✕
来源:
NETL
NSTL
维普
万方数据
基于RoBERTa与字词融合的电子病历命名实体识别方法研究
Research on named entity recognition method of electronic medical record based on RoBERTa and word fusion
王卫东
1
张志峰
1
徐金慧
1
杨习贝
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
江苏科技大学计算机学院,镇江 212100
折叠
摘要
为了提高所抽取电子病历文本中语义信息的准确性,提出基于RoBERTa与字词融合的电子病历命名实体识别算法.采用预训练模型RoBERTa得到充分考虑上下文信息的字向量;然后对文本进行分词处理,再通过Word2Vec得到词向量;最后将两者进行融合传入双向长短记忆神经网络BiLSTM中进行训练,经过条件随机场CRF进行预测输出.在电子病历数据集上进行的对比实验表明,在采用3个评价指标的情况下,文中算法均明显优于经典的电子病历命名实体识别方法.
关键词
电子病历命名实体识别
/
预训练模型RoBERTa
/
双向长短记忆神经网络
/
条件随机场
/
字词融合
引用本文
复制引用
基金项目
国家自然科学基金(51609110)
国家自然科学基金(51779110)
江苏省自然科学基金(BK20191461)
江苏省六大人才高峰资助项目(KTHY-064)
出版年
2023
江苏科技大学学报(自然科学版)
江苏科技大学
江苏科技大学学报(自然科学版)
影响因子:
0.373
ISSN:
1673-4807
引用
认领
被引量
1
参考文献量
3
段落导航
相关论文
摘要
关键词
引用本文
基金项目
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果