摘要
基因的转录调控和DNA复制与染色体的三维结构以及基因组的特征,如表观遗传标记、绑定的转录因子以及非编码RNA是紧密相关的。这些特征数据之间的相互作用以及染色体的结构形成了一个多层的三维调控网络。因此,需要将基因组的三维物理结构和这些特征数据整合起来,从而综合的解释它们与基因调控的关系。 在本文中,我们开发了一个集成的分析和可视化平台Delta,并探索了增强现实技术在三维基因组数据可视化上的应用。其中Delta中的分析平台构建在云平台之上,用于可视化的注释和探究基因组的三维物理结构。 本文首先研究了在云平台上构建三维基因组的数据分析平台。通过在云平台上封装三维基因组数据分析一些常用的软件,Delta可以在线提供三维基因组的数据分析服务,用于预测染色质的相互作用、拓扑结构关联域以及一致性的三维物理结构模型。 我们研究了三维基因组数据的全面可视化。通过使用4个可视化视图,即Virtual4C绘图、线性基因组视图、基因组环形视图和物理视图,对不同类型的特征数据进行了全面的可视化展示。同时,创新的提出了双视图模式,用于物理视图与线性或环形基因组视图的数据并排展示。 我们探索了增强现实技术在三维基因组数据可视化上的应用。在Microsoft HoloLens设备中,我们实现了三维基因组物理结构的增强现实可视化;在PC上,我们实现了线性基因组视图以及基因组环形视图;同时,我们开发了两端的数据交互接口,用于数据的同步显示。 最后,我们结合β-globin基因的调控网络模式应用案例,展示了Delta可以帮助科学家形成并初步验证模型猜想。使用BACH软件对K562细胞系的(5Kb和50Kb Hi-C文件,基因组位置范围11号染色体4.5Mb-6.5Mb)物理结构进行了预测,并在物理视图中进行了可视化,同时还加载显示了K562相互作用、LCR、高敏位点HS以及β-globin基因数据。在双视图模式下的线性基因组视图中,加载显示了K562细胞系对应的RNA-seq信号、DNase信号以及H3k4me3信号数据。通过观察可视化视图中展示的数据联系,我们发现构成β-globin基因表达三个可能因素,即β-globin基因与LCR在三维空间的近距离、可访问的启动子以及活跃的蛋白信号;同时,我们还发现在HS5与3'HS1之间存在一个染色质相互作用,可能会对β-globin基因表达产生影响。通过查阅相关的文献,证实了我们上面的这些猜想。