首页|血清叶酸与同型半胱氨酸对结直肠癌合并静脉血栓栓塞的影响及风险预测研究

血清叶酸与同型半胱氨酸对结直肠癌合并静脉血栓栓塞的影响及风险预测研究

曹英蕾

血清叶酸与同型半胱氨酸对结直肠癌合并静脉血栓栓塞的影响及风险预测研究

曹英蕾1
扫码查看

作者信息

  • 1. 山西医科大学
  • 折叠

摘要

目的: 1.通过横断面研究,了解结直肠癌患者合并静脉血栓栓塞现状,探讨血清叶酸和同型半胱氨酸对结直肠癌合并静脉血栓栓塞的影响。 2.通过构建机器学习风险预测模型,对结直肠癌患者合并静脉血栓栓塞进行风险预测,为静脉血栓栓塞预防提供依据。 方法: 1.本研究采用横断面研究方法。根据纳排标准,选取山西医科大学第一医院胃肠外科住院结直肠癌患者作为研究对象,由经过严格培训的资料收集员对2019年6月~2022年6月山西医科大学第一医院胃肠外科收治的结直肠癌病人进行病历资料收集,查阅相关电子病历系统,获得研究对象的相关信息,了解结直肠癌患者的一般人口学特征(性别、年龄、职业、婚姻情况、BMI指数)、结直肠癌相关指标(癌症家族史、原发位置、肿瘤分期)、现患疾病情况(高血压、心脑血管疾病、糖尿病、贫血、营养不良)、营养相关指标(NRS-2002评分、血清叶酸、血清同型半胱氨酸)、实验室相关指标(凝血酶原时间、活化部分凝血活酶时间、凝血酶时间、凝血酶原时间活动度、凝血酶原时间国际标准化比值、血红蛋白、血小板计数、红细胞计数、总蛋白、白蛋白、白细胞计数)、合并静脉血栓栓塞情况等,了解结直肠癌患者合并静脉血栓栓塞的影响因素,并建立风险预测模型进一步分析各因素对静脉血栓栓塞影响的重要性。 2.在横断面研究基础上,根据结直肠癌患者合并静脉血栓栓塞情况将其分为合并静脉血栓栓塞组与未合并静脉血栓栓塞组,进行病例对照研究。将患者是否合并静脉血栓栓塞(未合并=0,合并=1)作为因变量,建立非条件logistic回归模型,探讨结直肠癌患者合并静脉血栓栓塞的影响因素。考虑到结直肠癌患者合并静脉血栓栓塞由多个因素共同作用,本研究基于两种不同的机器学习算法与逻辑回归方法分别构建结直肠癌合并静脉血栓栓塞风险预测模型,旨在协助临床发现静脉血栓高危的结直肠癌患者,为静脉血栓栓塞预防提供参考。 3.数据录入采用Epidata3.1进行双录入,进行逻辑纠错和校验。数据采用SPSS26进行数据清理与数据分析。定量资料服从正态分布采用均值±标准差((x)±s)描述,通过t检验或方差分析进行统计分析,不服从正态分布采用四分位数间距(InterquartileRange,IQR)描述,统计分析采用秩和检验。定性资料采用构成比或发生率描述,通过x2检验、非条件logistic回归方法进行统计分析,纳入标准α入=0.10,剔除标准α出=0.15。以P<0.05为差异具有统计学意义。使用R4.2.2软件进行机器学习模型构建,使用训练集数据对风险预测模型进行训练,测试集数据用于评价模型预测风险能力。为确保预测模型的客观性与准确性,研究采用R4.2.2软件中“caret”包中“createDataPartition”函数将数据集进行拆分。所有模型均按7∶3比例划分训练集与测试集,从合并组与非合并组中随机抽取70%的样本作为训练集(n=245)构建预测模型,其余30%作为测试集(n=105)用以评估模型的预测能力。采用基于L1正则化思想lasso回归方法对数据集进行特征筛选。本研究选取两种机器学习算法与逻辑回归方法分别进行模型构建,机器学习算法包括:随机森林(RandomForest)与极端梯度提升(XGBoost)。预测模型评价指标包括ROC曲线下面积(aeraunderthereceiveroperationcharacteristiccurve,AUC)、准确率、精确度、特异度、灵敏度与f1值(f1-score)。在各指标不一致时,以AUC作为主要参考标准。 结果: 1.结直肠癌患者的一般情况 本研究共调查350名结直肠癌患者。①人口学特征:男性187人(53.40%)女性163人(46.60%),60岁及以上患者占比74.00%;职业中农民88人(25.10%),退休131人(37.40%),其他职业131人(37.40%);婚姻情况中已婚占比最高(93.10%);BMI指数<18.5kg/m2患者21人(6.00%),≥24.0kg/m2的患者160人(45.70%)。②结直肠癌相关及现患疾病情况:原发位置主要集中于直肠(40.00%),其他位置最少(12.90%);肿瘤分期中,Ⅲ期结直肠癌患者最多(60.60%),Ⅰ期(8.90%)与Ⅳ期(4.80%)结直肠癌患者最少;有癌症家族史患者14人(4.00%)。在现患疾病中,12.86%(45/350)的患者合并静脉合并静脉血栓栓塞;44.90%(157/350)的患者患有高血压,心脑血管疾病占比29.70%(104/350),15.10%(52/350)患有糖尿病,28.30%(99/350)人患有贫血,30.00%(105/350)出现营养不良。③营养相关指标情况:NRS-2002评分≥3分的患者占比76.90%(269/350),血清叶酸平均值为22.79±14.71nmol/L,血清同型半胱氨酸平均值为18.57±9.17μmol/L。④实验室相关指标:凝血相关指标中凝血酶原时间、活化部分凝血活酶时间、凝血酶时间、凝血酶原时间活动度、凝血酶原时间国际标准化比值的平均值分别为13.43±1.48s、28.73±3.59s、15.34±1.64s、96.95±1.07%、1.02±0.11;常规血液学指标包括血红蛋白、血小板计数、红细胞计数、总蛋白、白蛋白和白细胞计数,平均值分别为112.76±1.48g/L、264.01±6.48*10^9/L、3.95±0.67*10^12/L、64.21±7.36g/L、36.81±4.48g/L、6.08±2.45*10^9/L。 2.结直肠癌患者合并静脉血栓栓塞影响因素分析 2.1结直肠癌患者合并静脉血栓栓塞影响因素单因素分析 将患者是否合并静脉血栓栓塞(未合并=0,合并=1)作为因变量,单因素分析结果显示,职业、BMI指数、肿瘤分期、高血压、糖尿病、贫血、NRS-2002评分、血清叶酸、血清同型半胱氨酸、活化部分凝血活酶时间、血红蛋白、红细胞计数、总蛋白、白蛋白差异具有统计学意义(P<0.05)。 2.2结直肠癌患者合并静脉血栓栓塞影响因素多因素分析 根据实验室检测结果,绘制血清叶酸、同型半胱氨酸、活化部分凝血活酶时间、血红蛋白、红细胞计数、总蛋白与白蛋白的受试者工作特征(ROC)曲线,确定最佳截断值,采用最佳截断值对进行分组。将结直肠癌患者是否合并静脉血栓栓塞(否=0,是=1)作为因变量,建立非条件logistic回归模型,控制单因素分析中具有统计学意义及文献报道有关变量。结果显示,现患贫血的结直肠癌患者发生静脉血栓栓塞的风险是未患贫血的2.271倍(95%CI:1.042~4.950);血清同型半胱氨酸≥23.00μmol/L患者合并静脉血栓栓塞的风险是血清同型半胱氨酸<23.00μmol/L患者的2.623倍(95%CI:1.068~6.441);血清叶酸<10.69nmol/L比≥10.69nmol/L的结直肠癌患者更容易患静脉血栓栓塞(OR=0.408,95%CI:0.176~0.946),活化部分凝血活酶时间≥28.95s的患者患静脉血栓栓塞是<28.95s患者的0.378倍(95%CI:0.163~0.877)。 3.结直肠癌患者合并静脉血栓影响因素风险预警模型建立与分析 3.1机器学习风险模型建立与分析 通过lasso回归进行变量筛选,最终筛选出17个特征变量(职业、BMI指数、原发位置、肿瘤分期、癌症家族史、高血压、心脑血管疾病、糖尿病、贫血、营养不良、NRS-2002评分、血清叶酸、血清同型半胱氨酸、活化部分凝血活酶时间、凝血酶时间、血小板计数、白蛋白)进入模型作为输入变量,结直肠癌患者是否发生静脉血栓栓塞作为结局变量,基于随机森林、极端梯度提升(XGBoost)、逻辑回归分别建立结直肠癌合并静脉血栓栓塞的风险预测模型。结果显示:两种机器学习风险预测模型与逻辑回归AUC均在0.750以上,其中极端梯度提升(XGBoost)模型AUC在风险预测模型中最大(AUC:0.906)。极端梯度提升(XGBoost)模型准确度、f1值均在三种风险预测模型中表现最佳,分别为0.962、0.875;随机森林模型精确度、特异度均大于0.900,在三种风险预测模型中表现最佳。逻辑回归所得风险预测模型AUC为0.828,其准确度、精确度、特异度、f1值低于XGBoost模型,分别为0.774、0.405、0.753、0.555;灵敏度为0.882,均大于随机森林模型与极端梯度提升(XGBoost)模型。 3.2机器学习算法风险预测模型特征变量重要性结果 在两种机器学习算法与逻辑回归分别建立的风险预测模型,以ROC曲线下面积(AUC)作为主要参考值,极端梯度提升(XGBoost)所建立模型AUC最大,根据极端梯度提升(XGBoost)模型,将lasso回归所筛选出的特征变量进行重要性排序。结果显示,血清叶酸、血清同型半胱氨酸、白蛋白、BMI指数、职业、活化部分凝血活酶时间在特征变量排序中位于前列,是构建结直肠癌患者合并静脉血栓栓塞风险预测模型的关键指标,对结果的预测具有重要作用。血清叶酸占特征重要性的22.00%,血清同型半胱氨酸为19.30%,白蛋白为13.80%,BMI指数为11.30%,职业为8.00%,活化部分凝血活酶时间为7.70%。 结论: 1.患有贫血、高血清同型半胱氨酸、低血清叶酸、活化部分凝血活酶时间缩短是结直肠癌合并静脉血栓栓塞的危险因素。 2.血清叶酸与血清同型半胱氨酸对结直肠癌合并静脉血栓栓塞的预测效能最佳。 3.本研究结果提示,可以对患者适当进行叶酸补充,并且密切观察患者血清同型半胱氨酸的变化,为进一步将叶酸应用于临床预防与治疗提供参考;同时可借助风险预测模型协助临床医护对患者进行静脉血栓栓塞风险评估,为进一步降低结直肠癌患者静脉血栓栓塞发生率发挥潜能。

关键词

结直肠癌/静脉血栓栓塞/叶酸/同型半胱氨酸/风险预测

引用本文复制引用

授予学位

硕士

学科专业

公共卫生

导师

黄河

学位年度

2023

学位授予单位

山西医科大学

语种

中文

中图分类号

R73
段落导航相关论文