摘要
随着医院信息管理系统在我国的广泛应用,医院中医疗文本的产生速率也随之加快。这些医疗文本具有较高的科研价值,通过一定方法对电子病历中的信息进行数据挖掘,有助于加快实现医院的信息化建设,同时还可以辅助医生做诊前决策,节约时间成本,避免医疗事故的发生。为此本文以电子病历为实际研究对象,对电子病历的数据分析处理,实现对病历中关键词的提取,协助医生快速了解病历内容,并对给定的电子病历进行特征分析实现疾病预测。 本文首先分析了现有关键词提取的方法,针对电子病历的特点,提出了基于万有引力改进TextRank的关键词提取算法GTextRank。该算法将文档中的词语象征性地表示为具有质量的物质,词语与词语之间具有相互吸引力,并利用万有引力模型对词语在文档中的主题影响力、词语间距离和词语间共现频率进行有效融合,构建新的TextRank转移概率实现关键词的提取。最后在真实的电子病历进行分析验证,表明了该方法可提高关键词提取的准确度。 研究证明深度神经网络模型在自然语言处理的各项任务中具有独特优势,为此本文在基于GRU的特征提取与分类模型的基础上,提出将Attention机制与Bi-GRU模型相结合的策略来解决疾病预测问题,进一步提升疾病预测的准确度。融合Attention机制后的Bi-GRU模型可以通过对每一时刻下的状态加以不同的权重,在保留有效信息的基础上,最大程度解决信息冗余的问题,提升预测疾病的精度。 最后利用改进的关键词提取和疾病预测算法,设计一个电子病历的辅助诊断系统。实现了对患者信息的管理,并可通过输入病人的基本信息、主诉、现病史和专科检查等信息实现对病历抽取关键词,协助医生全局了解病历内容,同时可根据病人的病历信息实现辅助诊疗功能。该系统有效的实现了算法和实际应用的对接。