计算机技术与发展2022,Vol.32Issue(4) :186-192.DOI:10.3969/j.issn.1673-629X.2022.04.032

基于BERT-BILSTM的医疗文本关系提取方法

Relation Extraction Method of Medical Texts Based on BERT-BILSTM

龚汝鑫 余肖生
计算机技术与发展2022,Vol.32Issue(4) :186-192.DOI:10.3969/j.issn.1673-629X.2022.04.032

基于BERT-BILSTM的医疗文本关系提取方法

Relation Extraction Method of Medical Texts Based on BERT-BILSTM

龚汝鑫 1余肖生1
扫码查看

作者信息

  • 1. 三峡大学 计算机与信息学院,湖北 宜昌 443002
  • 折叠

摘要

健康医疗文本关系提取可充分利用医疗资源,为构建医院系统和相关知识图谱奠定基础,但健康医疗文本上下文联系紧密,内容结构复杂,使用传统的机器学习方法无法充分学习并利用文本中所包含的信息,且由于未针对文本中包含的医疗领域专业名词进行处理,使研究所需的重要实体流失,导致准确率不高.因此,提出了一种基于BERT和BILSTM融合的健康医疗文本关系提取方法,在预处理阶段进行医疗关键词提取,使用BERT语言模型进行词嵌入,再结合BILSTM和注意力机制进行特征处理,最后使用Softmax分类器输出类别概率值,确定实体间关系类别.基于两个临床医疗数据集的实验验证结果,与单向LSTM、CNN、BIGRU等模型进行比较分析,BERT-BILSTM-ATT模型表现最优,精确率提高3.35%以上、召回率提高1.28%以上、F1值提高2.58%以上,基于BERT和BILSTM融合的健康医疗文本关系提取方法能准确有效地预测健康医疗文本中实体之间存在的关系类别.

关键词

关系提取/双向长短期记忆神经网络/注意力机制/健康医疗文本/BERT

引用本文复制引用

基金项目

国家重点研究发展计划(2016YFC0802500)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量2
参考文献量12
段落导航相关论文