生物医学工程学杂志2024,Vol.41Issue(3) :552-559.DOI:10.7507/1001-5515.202311059

基于密度聚类的染色质拓扑相关结构域识别方法

An identification method of chromatin topological associated domains based on spatial density clustering

龚海燕 张司臣 张晓彤
生物医学工程学杂志2024,Vol.41Issue(3) :552-559.DOI:10.7507/1001-5515.202311059

基于密度聚类的染色质拓扑相关结构域识别方法

An identification method of chromatin topological associated domains based on spatial density clustering

龚海燕 1张司臣 2张晓彤3
扫码查看

作者信息

  • 1. 北京科技大学 新材料技术研究院(北京 100083);北京科技大学 顺德创新学院(广东佛山 528399)
  • 2. 北京科技大学 计算机与通信工程学院(北京 100083)
  • 3. 北京科技大学 计算机与通信工程学院(北京 100083);北京科技大学 顺德创新学院(广东佛山 528399)
  • 折叠

摘要

高通量染色质构象捕获(Hi-C)技术的快速发展为染色质结构分析提供了丰富的基因组位点间交互作用数据,但目前基于Hi-C数据的已有拓扑相关结构域(TAD)识别方法存在准确率低、参数敏感等问题.在此背景下,本文设计并实现了一种基于空间密度聚类的TAD识别方法.该方法首先对原始Hi-C数据进行预处理,得到归一化后的Hi-C接触矩阵数据;然后计算位点之间的距离矩阵,基于位点的核心距离和可达距离生成可达性图,并提取聚类簇;最后基于聚类结果和TAD提取边界.该方法能够识别出内聚性更高的TAD结构,且TAD边界处富集了更多的ChIP-seq因子.实验结果表明,本文方法在TAD识别中更准确,更具有现实意义.

Abstract

The rapid development of high-throughput chromatin conformation capture(Hi-C)technology provides rich genomic interaction data between chromosomal loci for chromatin structure analysis.However,existing methods for identifying topologically associated domains(TADs)based on Hi-C data suffer from low accuracy and sensitivity to parameters.In this context,a TAD identification method based on spatial density clustering was designed and implemented in this paper.The method preprocessed the raw Hi-C data to obtain normalized Hi-C contact matrix data.Then,it computed the distance matrix between loci,generated a reachability graph based on the core distance and reachability distance of loci,and extracted clustering clusters.Finally,it extracted TAD boundaries based on clustering results.This method could identify TAD structures with higher coherence,and TAD boundaries were enriched with more ChIP-seq factors.Experimental results demonstrate that our method has advantages such as higher accuracy and practical significance in TAD identification.

关键词

高通量染色质构象捕获/拓扑相关结构域/染色质结构/密度聚类/生物信息学分析

Key words

High-throughput chromatin conformation capture/Topologically associated domain/Chromatin structure/Density-based clustering/Bioinformatics analysis

引用本文复制引用

基金项目

国家重点研发项目(2023YFB3812901)

中国博士后科学基金资助项目(2023M740219)

国家资助博士后研究人员计划(GZC20230239)

出版年

2024
生物医学工程学杂志
四川大学华西医院 四川省生物医学工程学会

生物医学工程学杂志

CSTPCD北大核心
影响因子:0.432
ISSN:1001-5515
参考文献量31
段落导航相关论文