基于深度学习的人工智能技术在慢性阻塞性肺疾病中的诊断及预测研究

李宗莉¹

扫码查看

作者信息

1. 首都医科大学
折叠

摘要

慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一种不可逆、进行性发展的疾病，早发现和早诊断可降低疾病负担和死亡率。除了诊断之外，评估其严重程度将有助于为COPD患者提供个性化、精准化的治疗。目前，肺功能测试(pulmonary function tests,PFTs)是COPD诊断的金标准，并可对COPD进行严重程度分级，但其反映的只是整个呼吸系统功能改变，无法反映COPD的异质性。COPD的异质性体现为多种病理生理过程，包括肺实质破坏、支气管壁增厚、肺间质异常、支气管扩张、肺血管改变等。胸部计算机断层扫描(CT)可以定量测量上述病理生理异常，是表征COPD异质性最常用的成像方式。随着人工智能、大数据时代来临，放射组学(radiomics)及图卷积神经网络(graph convolution neural network,GCN)作为新兴的技术在临床中的作用得到越来越多的证实。但其在COPD诊断和严重程度分级方面的研究仍处于初始阶段。目的：本研究利用放射组学及图卷积神经网络进行建模，用来进行COPD的识别和严重程度分级。方法：(1)放射组学。这项回顾性研究包括322名参与者(249名COPD患者和73名对照组受试者)。在汇影大数据人工智能科研平台上从每个参与者的CT图像中提取出1395个放射组学特征。采用方差阈值法、SelectKBest法和最小绝对收缩选择算子(LASSO)三种特征选择方法筛选出最优特征，构建基于支持向量机(SVM)和逻辑回归(LR)的分类器，对322名参与者是否患有COPD以及患有COPD的严重程度进行分类。(2)图卷积神经网络。这项研究利用GCN模型在公开的丹麦肺癌筛查研究(Danish Lung Cancer Screening Trial,DLCST)公开数据库数据集上识别COPD,该数据集包含近90％的早期轻中度COPD患者。首先，将COPD识别看成图分类问题，来自同一患者的ROI相互连接，构建用于建模的图。然后采用切比雪夫多项式滤波器，将构建好的图输入到GCN模型中进行COPD识别。最后，将GCN模型同其他模型在DLCST数据集上进行比较。结果：(1)放射组学。分别筛选出38个和10个最优特征用于构建COPD识别和COPD严重程度分级的放射组学模型。对于COPD识别，SVM分类器在训练集和测试集上的AUCs分别为0.992和0.970,LR分类器在训练集和测试集上的AUCs分别为0.993和0.972。对于COPD严重程度分级，上述两种机器学习分类器可以更好地区分严重程度较轻(GOLD1+GOLD2)组和严重程度较高(GOLD3+GOLD4)组，AUCs在训练集中分别为0.907和0.903,在测试集中分别为0.799和0.797。(2)图卷积神经网络。本文构建的GCN模型对于COPD识别达到了0.77的准确率，AUC为0.81。相比多示例学习(multiple instance learning,MIL)，LightGBM,ResNet50,VGG16,DenseNet121等模型，GCN模型达到最优结果。结论：本研究表明，基于CT图像的放射组学方法或图神经网络的模型对于研究COPD,如疾病识别和严重程度分级，有较高的准确率，部分模型准确率超过97％,这对COPD早发现、早治疗、降低病情恶化风险、提升治疗效果，都有较高的研究意义和临床意义。

关键词

慢性阻塞性肺疾病/计算机断层扫描/放射组学/图神经网络

引用本文复制引用

授予学位

博士

学科专业

内科学（呼吸系病）

导师

黄克武

学位年度

2022

学位授予单位

首都医科大学

语种

中文

中图分类号

段落导航