摘要
随着人类基因组计划的完成和近年来以新一代高通量测序技术为代表的高通量生物实验技术的发展,人们大规模获取生物信息的能力有了突飞猛进的提高,推动生命科学研究迅速进入了信息时代。不论是疾病基因组学、表观基因组学、蛋白质组学的研究还是系统生物学、合成生物学等新兴学科的发展,都无一例外地建立在对生物信息进行高通量观测和计算分析的基础上,对各种生物信息的有效处理、分析和利用,成了生命科学中众多基础和应用研究领域的核心技术。同时,随着基因组学、系统生物学研究的日益深入和推广,以及个体化基因组、个体化医疗逐步走上议事日程,对生物信息学和计算系统生物学方法与技术的市场需求也将迅速增长。针对科学研究和社会发展对生物信息学和计算系统生物学方法与技术提出的重大需求,本课题的总体任务是针对高通量生物实验数据,研发生物信息学与计算系统生物学方法,进而把成果转化为应用软件和专利技术,并开展各类专业领域综合示范应用。课题针对的高通量生物实验数据包括新一代深度测序数据、蛋白质修饰组学数据和跨层次生物影像数据等。这些高通量数据,在通量、分辨率、获取的成本、能够检测的信息类型等方面都较传统的生物学实验数据有巨大飞跃。这些数据对生命科学研究带来了革命,对生物信息学带来了新的机遇和挑战。与这些高通量实验数据相关的生物信息学与计算生物学技术,是当前和今后相当长一段时间内生物信息学和计算生物学最关键的技术之一。本课题在执行期间取得的突破性进展包括:1) 建立了外显子测序数据的处理分析方法;2) 建立了RNA测序数据处理的流程和分析方法;3) 建立了宏基因组测序数据的处理分析方法;4) 开发了乙酰化和去乙酰化特异性修饰位点的识别方法;5) 构建了从内源信号光学成像到双光子显微成像的分层编码、标识和封装体系。