首页|通过多组学联合生物信息分析鉴定人基因组中潜在编码的小开放阅读框

通过多组学联合生物信息分析鉴定人基因组中潜在编码的小开放阅读框

丁建成

通过多组学联合生物信息分析鉴定人基因组中潜在编码的小开放阅读框

丁建成1
扫码查看

作者信息

  • 1. 厦门大学
  • 折叠

摘要

人类基因组中的大部分DNA都可以被转录,从而产生了大量的RNA序列。当前主要通过算法来识别其中可编码的部分,但这过程会导致对真核生物编码潜力的严重低估。越来越多的证据表明,一些RNA序列被错误地注释为非编码的,但实际上这些RNA序列(开放阅读框)可以编码功能重要的微蛋白,其中有些有希望成为用于对抗肿瘤生长的药物靶标或预后的生物标志物。随着组学数据的准确性和敏感性的提高,使得使用直接的实验证据来发现和验证可编码的小开放阅读框成为可能。本文旨在系统的鉴定结直肠癌和乳腺癌中有编码潜能的小开放阅读框,并尝试鉴定肿瘤组织中特异表达的微蛋白。方法:(1)采集结直肠癌细胞系HCT116和乳腺癌细胞系MCF7的翻译组数据和蛋白质组数据,建立相关数据的生物信息分析方法。从不同水平鉴定两种细胞系中可能编码的小开放阅读框,并比较各种方法的优劣。(2)分别采集4位结直肠癌和4位乳腺癌患者的肿瘤组织和癌旁组织样本的蛋白质组数据。通过蛋白质组数据分析鉴定肿瘤和正常组织中可能存在的微蛋白和肿瘤组织特异的微蛋白。结果:通过多核糖体谱方法在HCT116和MCF7中分别鉴定到了2013和2197个可能编码的非编码基因。通过Ribo-seq方法在HCT116和MCF7中分别鉴定到了1175和307个可能编码的非编码基因,7459和3919个可能含有新编码框的编码基因。通过蛋白质组方法在HCT116、MCF7、结直肠癌和乳腺癌临床样本中分别鉴定到了406、321、547、719个可能含有新编码框的基因。其中在HCT116和MCF7细胞系中多种方法共同鉴定到的基因分别有28和22个。总结:本文结合了翻译组学和蛋白组学数据,系统的鉴定到了一些新的可编码小开放阅读框,这些小开放阅读框可以作为进一步的研究对象,为开发肿瘤治疗药物和预后的生物标志物提供支撑和基础。

关键词

小开放阅读框/微蛋白/非编码RNA/蛋白质组学

引用本文复制引用

授予学位

博士

学科专业

化学生物学

导师

刘文

学位年度

2021

学位授予单位

厦门大学

语种

中文

中图分类号

Q98
段落导航相关论文