首页|基于深度学习的中医古籍缺失文本修复研究

基于深度学习的中医古籍缺失文本修复研究

扫码查看
目的:基于构建的高质量中医古籍文本语料库及深度学习语言模型,训练出可以应用于中医古籍缺失文本修复的模型,为中医古籍修复工作提供帮助.方法:分别训练和测试N-gram模型、LSTM模型、BiLSTM模型、RoBERTa模型,对比筛选出最优模型,并将筛选出的最优模型运用到文本修复场景中.结果:BiLSTM模型优于LSTM模型,LSTM模型明显优于N-gram模型,而RoBERTa模型效果最优,将RoBERTa模型运用到《黄帝内经》的修复中,达到了63.36%的hit@1,82.57%的hit@5.结论:将深度学习技术应用于中医古籍缺失文本修复中具有较好的效果,能够为中医古籍修复提供帮助.
The restoration of missing texts in ancient books of Traditional Chinese Medicine based on deep learning

盛威、卢彦杰、刘伟、胡为、周冲

展开 >

湖南中医药大学信息科学与工程学院,湖南 长沙 410208

中医古籍 语言模型 文本修复 深度学习 RoBERTa

湖南省教育厅科研项目湖南省自然科学基金湖南中医药大学研究生创新课题

20C14352022JJ304382022CX121

2022

中华医学图书情报杂志
解放军医学图书馆

中华医学图书情报杂志

影响因子:1.247
ISSN:1671-3982
年,卷(期):2022.31(8)
  • 4
  • 2