摘要
目的 结直肠癌(ColorectalCancer,CRC)为全球最常见的恶性肿瘤之一,严重威胁着人类健康。CRC的发生是一个复杂的多阶段癌变过程,为环境因素和遗传因素的共同作用的结果,但其确切病因尚未完全阐明。本研究采用病例对照研究方法分析环境因素及端粒长度与CRC发病风险的关联,为CRC高危人群的筛选及防治策略的制定提供科学依据。 方法 1.采用1∶1的频数匹配病例对照研究,于2017年8月至2021年6月,在福建医科大学附属第一医院和福建医科大学附属协和医院严格按纳入和排除标准招募研究对象,最终纳入826例首次确诊的CRC患者,及与之在性别、年龄(±2岁)匹配的826例健康人群对照。采用自制调查表,由经过专业培训的调查人员进行面对面调查收集流行病学信息。问卷内容包括人口学特征、健康相关行为、个人疾病史及肿瘤家族史等。运用?2检验、非条件Logistic回归模型等统计方法,计算调整比值比(OddRatio,OR)及其95%可信区间(95%ConfidenceInterval,95%CI),评估环境因素及环境因素之间的联合作用对CRC发病风险的影响。进一步通过Logistic回归的逐步法、全子集回归和LASSO回归探索环境风险模型,并且借用机器学习方法中的随机森林进行分类预测及变量重要性排序。 2.检阅文献,根据纳入和排除标准筛选出与端粒长度具有显著关联的独立单核苷酸多态性(SingleNucleotidePolymorphisms,SNP)位点,作为工具变量。应用核酸质谱MassArraySNP分型系统对筛选出来的SNPs位点进行基因分型。两样本的孟德尔随机化(Mendelianrandomization,MR)研究中采用逆方差加权法(Theinverse-varianceweightingmethod,IVW)估计端粒长度与CRC发病风险之间的效应,并利用Egger回归和加权中位数法(Weightedmedianestimation)进行敏感性分析和多效性评估。此外,构建遗传风险评分后(Geneticriskscore,GRS)通过多分位划分后探索端粒长度和CRC发病风险之间的关系,利用分层分析探讨在各变量中不同等级的GRS与CRC发病风险的关联,及Logistic回归和叉生分析等分析GRS与环境因素的交互作用。 结果 1.多因素非条件Logistic回归分析结果显示:饮酒、口味咸和红肉摄入频率高是CRC的危险因素,其各层OR值及95%CI分别为1.546(1.189-2.011)、1.462(1.100-1.942)、1.773(1.298-2.422)、2.850(1.433-5.667)和1.885(1.376-2.581);而居住城市、BMI≥24、高血压和糖尿病则是CRC的保护因素,其OR值及95%CI分别为0.236(0.061-0.920)、0.699(0.552-0.886)、0.260(0.174-0.388)和0.070(0.032-0.151)。吸烟与饮酒之间存在交互作用(OR=1.696,95%CI:1.208-2.381)。 2.LASSO回归发现,最终的模型纳入了民族、BMI、居住地、饮酒、高血压、糖尿病、慢性病药物服用史、口味和红肉摄入频率;通过全子集回归显示,R2最大时纳入的指标有BMI,居住地,饮酒,高血压,糖尿病,慢性病药物服用史、口味和红肉摄入频率。随机森林分析结果显示,两个数据集有较好的性能,影响CRC重要性的前三因素分别是年龄、红肉摄入频率和慢性病药物服用史。 3.14个端粒长度相关SNPs与CRC发病风险的分析结果显示:rs10936600A>T在超显性遗传模型下,AA或TT基因型携带者的CRC发病风险是AT基因型携带者的0.733倍(95%CI:0.559-0.961);rs55749605在显性遗传模型下,AA或CA基因型携带者的CRC发病风险是CC基因型携带者的0.524倍(95%CI:0.300-0.917);rs4691895在共显性遗传模型下,CC基因型携带者的CRC发病风险是GG基因型携带者的1.972倍(95%CI:1.038-3.745),在显性遗传模型下,GC或CC基因型携带者的CRC发病风险是GG基因型携带者的1.937倍(95%CI:1.028-3.650);rs7705526在显性遗传模型下,AA或CA基因型携带者的CRC发病风险是CC基因型携带者的1.744倍(95%CI:1.265-2.403)。 4.端粒长度与CRC关联的MR分析结果显示,关联分析a(纳入所有的SNPs)和b(排除了连锁不平衡后的8个SNPs)结果显示端粒长度每缩短一个单位长度(kb),CRC的发病风险分别增加0.030倍(OR=1.030,95%CI:0.650-1.409)和0.170倍(OR=1.170,95%CI:0.656-1.684),但关联均未达到统计学意义(P>0.05)。在敏感性分析中,分析b的Egger回归结果提示,较短的端粒长度与CRC发病风险的存在关联(OR=2.556,95%CI:1.210-3.902,P<0.05),多效性检验提示这其中可能存在多效性(OR=-0.080,95%CI:-0.154-0.006,P<0.05),并且截距项为负值,提示该结果可能会低估较短端粒长度对CRC的作用大小。 5.通过8个端粒长度相关的SNPs位点构建GRS后进行五分位分组,发现以第二分位作为对照时,第三分位GRS的CRC发病风险是其0.645倍(95%CI:0.421-0.987),但未发现其他分位的GRS与CRC发病风险存在显著关联(P>0.05)。在无慢性病药物服用史和无肿瘤家族史的人群中,第二分位GRS的CRC发病风险分别是第一分位的0.656倍(95%CI:0.434-0.993)和0.667倍(95%CI:0.467-0.953)。另外,GRS和吸烟饮酒之间均存在交互作用(OR=1.238,95%CI:1.009-1.520和OR=1.348,95%CI:1.092-1.663)。 结论 1.环境因素与CRC的发生密切相关,饮酒、口味偏咸和红肉摄入过多可增加CRC的发病风险,并且吸烟与饮酒之间存在相乘和相加交互作用。在CRC的环境风险模型中慢性病药物服用史、口味、居住地、红肉摄入频率、糖尿病和高血压占据更重要的位置。 2.端粒长度相关的SNPs(rs10936600、rs4691895、rs55749605和rs7705526)与中国汉族人群CRC的遗传易感性具有相关性。 3.端粒长度可能与CRC发病风险之间的存在非线性关联,但研究结果仍需要进一步的研究加以验证。