中华医学图书情报杂志2022,Vol.31Issue(10) :27-32.DOI:10.3969/j.issn.1671-3982.2022.10.005

基于临床病历预训练语言模型的病历文本纠错探索

Exploration of medical record text error correction based on clinical medical record pre- training language model

奈存剑 杨亮 陈文昌 李林峰 任宇飞 汪火明 张晓祥
中华医学图书情报杂志2022,Vol.31Issue(10) :27-32.DOI:10.3969/j.issn.1671-3982.2022.10.005

基于临床病历预训练语言模型的病历文本纠错探索

Exploration of medical record text error correction based on clinical medical record pre- training language model

奈存剑 1杨亮 2陈文昌 2李林峰 2任宇飞 1汪火明 1张晓祥1
扫码查看

作者信息

  • 1. 华中科技大学同济医学院附属同济医院,湖北 武汉430030
  • 2. 医渡云(北京)技术有限公司,北京100039
  • 折叠

摘要

电子病历文本中存在错别字既不符合国家电子病历管理规范,又降低了自然语言处理技术的效果,影响了电子病历的价值挖掘与应用.阐述了一种基于在大量真实病历语料上训练出的预训练语言模型进行自动纠错的方法.实验证明,该方法在仿真数据集和真实病历数据集上检错和纠错都取得了很好的效果,运行效率很高,可以支持事中和事后的电子病历纠错,有效提升电子病历质量,推动电子病历的应用.

关键词

电子病历/文本纠错/深度学习/预训练语言模型

引用本文复制引用

基金项目

国家卫生健康委标准修制订项目(2020090)

出版年

2022
中华医学图书情报杂志
解放军医学图书馆

中华医学图书情报杂志

影响因子:1.247
ISSN:1671-3982
参考文献量2
段落导航相关论文