摘要
乳腺癌(breastcancer,BC)是严重威胁女性身心健康的恶性肿瘤之一,其发病率和死亡率总体呈上升趋势,不同种族和民族的发病率和死亡率也存在较大差异,这可能是受到社会、生活方式、种族遗传等因素的影响。目前,我国乳腺癌发病率持续上升,因此探讨中西方乳腺癌影像表型和分子水平的差异,对进一步理解乳腺癌的致病机制,了解中国乳腺癌的患病特点是十分必要的。 我们利用影像基因组学方法,分析中国和西方乳腺癌患者肿瘤成像数据与遗传数据的差异,并探讨表型数据与遗传信息的相关性。在本论文中,我们分别分析了乳腺癌患者的图像特征和转录组数据,然后利用统计分析的方法将磁共振成像表型与转录组数据相关联,以开发影像基因组学特征。将数据输入到建立的随机森林模型,并使用接收器工作曲线下面积(areaunderthecurve,AUC)来评估分类性能。我们证明,结合相关基因数据和影像学特征,比单独使用基因或影像学特征能更好地表现出中国和西方患者之间的差异。使用图像特征、差异基因和影像基因组学特征进行中西方乳腺癌分类,对应的AUC值分别为0.74、0.81和0.95。接下来,分析差异表达基因中的关键基因,获得七个关键基因:SYT4、GABRG2、CHGA、SLC6A17、NEUROG2、COL2A1和MATN4,研究得出这些基因与某些成像特征呈正或负相关。此外,我们发现SLC6A17、NEUROG2、CHGA和MATN4基因与临床特征相关,可能是导致中国和西方乳腺癌患者在临床上表现不同的原因之一。 为了进一步分析不同种族在乳腺癌亚型之间是否存在差异,我们分别将LuminalA和LuminalB患者与正常样本进行差异分析,并通过对比分析中西方患者差异基因的不同,获得中国患者特有的表达异常基因,在外部数据集上进行验证。最后,进行中西方LuminalA、LuminalB乳腺癌免疫浸润分析,并将得到的目的基因与免疫浸润细胞进行相关性分析,这可能是影响中国乳腺癌患者生存的重要因素之一。结果显示,中西方患者不仅在每个分型下的异常基因不同,而且肿瘤免疫微环境也存在差异。对LuminalA型患者分析得到的SYNM基因与生存有关,表达量越高,生存表现越优秀,并且该基因表达量与单核细胞、γ-δ型T细胞的含量均有关联。在LuminalB型下得到的INTS8基因与生存呈负相关,表达量越高,生存越差,INTS8表达量与NK活化细胞、单核细胞含量呈负相关。与西方患者相比,中国患者SYNM和INTS8基因的表现均相对较好,这可能是中国LuminalA和LuminalB型患者生存率较高的原因。 乳腺癌是一个多因素混杂的疾病,种族间的基因组差异或表达差异均可能对临床表现造成影响,我们通过探究中西方乳腺癌患者影像与基因特征的差异,为进一步针对不同人群和种族的乳腺癌治疗带来启发。