计算机研究与发展2021,Vol.58Issue(3) :513-527.DOI:10.7544/issn1000-1239.2021.20200402

电子病历文本挖掘研究综述

Review on Text Mining of Electronic Medical Record

吴宗友 白昆龙 杨林蕊 王仪琦 田英杰
计算机研究与发展2021,Vol.58Issue(3) :513-527.DOI:10.7544/issn1000-1239.2021.20200402

电子病历文本挖掘研究综述

Review on Text Mining of Electronic Medical Record

吴宗友 1白昆龙 2杨林蕊 3王仪琦 2田英杰1
扫码查看

作者信息

  • 1. 中国科学院大学经济与管理学院 北京100049
  • 2. 中国科学院大学计算机与科学技术学院 北京100049;中国科学院虚拟经济与数据科学研究中心(中国科学院大学) 北京100190;中国科学院大数据挖掘与知识管理重点实验室(中国科学院大学) 北京100190
  • 3. 中国科学院虚拟经济与数据科学研究中心(中国科学院大学) 北京100190;中国科学院大数据挖掘与知识管理重点实验室(中国科学院大学) 北京100190;中国科学院大学中丹学院 北京100049
  • 折叠

摘要

电子病历是医院信息化发展的产物,其中包含了丰富的医疗信息和临床知识,是辅助临床决策和药物挖掘等的重要资源.因此,如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来,随着计算机技术尤其是机器学习以及深度学习的蓬勃发展,对电子病历这一特殊领域数据的挖掘有了更高的要求.电子病历综述旨在通过对电子病历研究现状的分析来指导未来电子病历文本挖掘领域的发展.具体而言,综述首先介绍了电子病历数据的特点和电子病历的数据预处理的常用方法;然后总结了电子病历数据挖掘的4个典型任务(医学命名实体识别、关系抽取、文本分类和智能问诊),并且围绕典型任务介绍了常用的基本模型以及研究人员在任务上的部分探索;最后结合糖尿病和心脑血管疾病2类特定疾病,对电子病历的现有应用场景做了简单介绍.

关键词

电子病历/自然语言处理/数据挖掘/机器学习/深度学习

引用本文复制引用

基金项目

国家自然科学基金(71731009)

国家自然科学基金(61472390)

中国科学院科技服务网络计划项目(KFJ-STS-ZDTP-060)

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量35
参考文献量11
段落导航相关论文