摘要
目的:心房颤动(atrialfibrillation,AF)是最常见的快速型心律失常,其发病率逐年增加。多种危险因素均可影响AF的发生,心力衰竭(heartfailure,HF)也是其中之一,同时HF又是AF的严重并发症之一,由于二者有共同的危险因素,所以经常共存,研究表明合并HF的AF患者往往预后不良,而AF患者出现新发HF的因素尚不清楚。既往多采用传统统计学方法进行研究,但随着机器学习技术的快速发展,其在处理医学数据中显示出巨大优势,尤其在心血管领域,因此我们将利用机器学习方法来建立HF风险评估模型,以识别发生HF风险较高的AF人群。 方法:利用大连医科大学附属第一医院电子病历系统连续纳入在2010年12月至2021年6月期间于我院住院首次诊断AF但尚未出现HF的患者,从电子病历系统和超声心动图数据库中收集这部分患者的临床资料和研究终点,最终采用26个临床变量进入机器学习。我们利用五种方法包括Logistic回归、支持向量机、决策树、随机森林和极端梯度增强(extremegradientboosting,XGBoost)为纳入的研究人群(按80∶20的比例分为训练集和验证集)构建预测模型。ROC曲线(receiver-operatingcharacteristiccurves,ROC)用于评估预测模型的有效性。SHAP图(Shapleyadditiveexplanation,SHAP)对临床因素的特征重要度进行排序,从而筛选出具有最优性能的最佳预测因子。 结果:最终3527例患者纳入研究,经过中位数46.18(27.29,68.41)个月的观察,690例(19.6%)AF患者出现HF,包括592例(16.8%)射血分数保留型HF(HFwithpreservedejectionfraction,HFpEF),98例(2.8%)射血分数降低型HF(HFwithreducedejectionfraction,HFrEF),剩余的2837例(80.4%)未发生HF作为对照组。以上患者的26个临床因素均没有缺失值,将这部分患者的全部信息输入机器学习。在5种机器学习方法中XGBoost表现出最高的预测效能,其曲线下面积(areaunderthecurve,AUC)达到了0.97,F1值为0.93,布莱尔分数为0.0125。亚组分析显示,XGBoost在预测HFpEF及HFrEF均显示出较好的预测价值,AUC分别为0.98、0.78。利用XGBoost对SHAP图中特征重要度排名前8位的临床因素重新建模,结果发现其预测HFpEF的AUC为0.99,而预测HFrEF的AUC仍为0.78。 结论:基于电子病历系统采用新的机器学习算法在预测AF患者出现新发HF事件方面具有较高的准确性,尤其是XGBoost有显著优势,并且利用特征重要度排名前8位的因素所构建的简易模型依然有效。这有助于我们在临床工作中识别潜在的可能会出现HF的AF患者,以利于对危险因素进行早期干预并做出临床决策,从而减少HF发生率,降低AF患者病死率,改善其远期预后。