摘要
背景与目的: 结直肠癌(Colorectal cancer,CRC)是全世界第四大癌症致死原因。饮食习惯西方化、超重及缺乏运动等原因导致我国CRC发病率逐年升高。目前传统肿瘤标志物应用于 CRC 早诊的临床效果并不理想。由于 CRC 生长部位隐匿,影像学检查在分辨率和病灶良恶性判断方面都存在着不足。组织病理学检查属于侵入性检查,且无法应用于肿瘤早期。因此开发新型生物标志物用于CRC早期诊断,对提高患者疗效延长患者生存期十分关键。液体活检是一种对多种生物学样本进行无创检测和动态分析的新兴技术,由于具有操作简便、可重复实验、能反映肿瘤原发或转移部位的生物学信息等优势,因此在实体肿瘤早期诊断、预后评估,揭示发病机理和寻找药物靶点等方面均有巨大应用前景。游离脱氧核糖核酸(cell-free DNA,cfDNA)作为液体活检的重要检测指标已被证实能够反应肿瘤组织的信息,特别是 cfDNA甲基化与 5 羟甲基化指标已在多种肿瘤中被证明可作为新型肿瘤诊断或监测分子标志物。cfDNA中包含了循环游离核DNA(cell-free nuclear DNA,cf-nDNA)及循环游离线粒体 DNA(cell-Free mitochondrial DNA,cf-mtDNA)。与 cf-nDNA相比,cf-mtDNA 不仅能够反映肿瘤组织信息,且具有基因组小、突变率高、拷贝数多等特点,在测序分析中更具优势,因此mtDNA在肿瘤诊断方面具有重大潜力。 本课题旨在通过系统分析结直肠癌患者和非肿瘤对照患者的cf-mtDNA拷贝数及片段组学特征,筛选结直肠癌特异性新型标志物,从而为结直肠癌早期诊断和预警筛查提供新方法和新策略。 方法: 1. 从空军军医大学第一及第二附属医院入组结直肠癌患者80例、肠良性疾病患者40例。收集入组患者的临床信息,包括年龄、性别、身高、体重、入院体征、既往病史、家族史、血清肿瘤标志物及影像学检查结果。 2.收集入组患者外周血4 mL,从中提取cfDNA,构建全基因组文库,利用靶向线粒体DNA捕获技术特异性富集mtDNA文库,检测cf-mtDNA基因组拷贝数(copy number)、片段大小(fragment size)、末端基序(end motif)特征。 3.对比结直肠癌组及肠良性病组人群之间cf-mtDNA的差异特征。经统计学分析比较结直肠癌组及肠良性疾病组患者之间cf-mtDNA的拷贝数和片段组学特征,通过单因素分析筛选结直肠癌相关特征变量。 4. 联合 cf-mtDNA 特征变量、临床信息及传统肿瘤标志物,利用逻辑回归(logistic regression)回顾性研究初步构建结直肠癌诊断模型。通过绘制受试者工作特征曲线(receiver operating characteristic curve,ROC curve),计算模型的灵敏度(sensitivity)、特异性(specificity)比较 cf-mtDNA 模型、临床指标模型及 cf-mtDNA联合临床指标模型的诊断效能,明确基于 cf-mtDNA构建的模型在检测结直肠癌中的优势。 5. 分析最终所构建的CRC诊断模型与患者年龄、性别及肿瘤分期的相关性,对CRC诊断模型的临床应用进行初步评估。 结果: 1. 2021年9月至2022年3月从空军军医大学第一及第二附属医院筛选并收集结直肠癌、肠良性病人群的临床信息及血浆样本。最终入组 110例,其中结直肠癌 79例,肠良性病31例。所有入组人群均符合入组条件且已签署知情同意书。 2.完成全部110例样本的cfDNA提取,全基因组文库构建以及靶向线粒体DNA捕获测序。使用Qubit4.0对所提取 cfDNA及全基因组文库进行浓度质控,结果符合要求;使用 Agilent2100对全基因组文库及靶向捕获线粒体 DNA片段进行检测,结果符合测序要求。 3. 靶向mtDNA测序结果显示结直肠癌者与肠良性病患者的血浆cf-mtDNA拷贝数、90~190 bp的mtDNA片段及片段末端CCA碱基占比具有统计学差异(P<0.05)。结直肠癌者与肠良性疾病病患者的年龄及 CEA 两项临床指标具有统计学差异(P<0.05)。 4.将上述合计5项指标进行逻辑回归分析,共构建CRC诊断模型26种。通过绘制 ROC 曲线分析发现联合血浆 cf-mtDNA 特征及临床指标特征(copy number、fragment、end motif、年龄、CEA)构建的结直肠癌诊断模型 CRC Diagnosis-score (CD-score)能够很好的鉴别结直肠癌与肠良性疾病。CD-score 模型诊断效能(AUC=0.9771)>单独血浆 cf-mtDNA 特征(copy number、fragment、end motif)模型诊断效能(AUC=0.9364)>单独临床临床指标特征(年龄、CEA)建模型诊断效能(AUC=0.8323)。 5.分析CD-score模型与临床指标的相关性,发现受试者年龄与CD-score显著相关,即年龄为 CRC 的风险因素(P<0.05)。不同性别、肿瘤分期、及肿瘤部位的CRC患者间的CD-score值无统计学差异(P>0.05),CD-score模型在临床应用时不易受到性别、肿瘤分期、肿瘤部位的影响。 结论: 本研究基于二代测序平台进行mtDNA靶向捕获测序分析,发现结直肠癌患者及肠良性疾病患者的血浆 cf–mtDNA 拷贝数、片段大小分布及片段末端碱基序列占比存在统计学差异,可辅助鉴别诊断结直肠癌。cf-mtDNA拷贝数及片段组学特征联合年龄及传统肿瘤标志物 CEA 构建的结直肠癌诊断模型 CD-score 有着较高的诊断效能,可为结直肠癌的临床诊断提供了新方法和新策略。