摘要
全基因组关联研究(Genome-Wide Association Study,GWAS)是在全基因组范围内对遗传变异进行检验,以发现与特定性状或复杂疾病显著关联的基因变异。然而这些变异只解释了大多数性状整体遗传力的一小部分,而联合分析多个性状能提高识别新的基因变异的功效,特别是多效性基因变异。另外,由于个体水平数据难以获得,而汇总数据通常是公开可用的,且关于各种性状的汇总数据日益增多,所以基于汇总数据的方法变得越来越流行。本文提出了基于主成分的自适应关联检验(Adaptive Test based on Principal Components,ATPC),该方法基于汇总数据检验单个基因变异与多元性状的关联性。 ATPC方法首先在性状相关矩阵的基础上构建一系列包含不同数量主成分的检验统计量,其次计算出这些统计量所对应的P值,最后利用聚合柯西关联检验结合这些P值,得到最终的检验统计量。模拟研究的结果表明,ATPC方法能控制第一类错误率,与几个多元性状关联方法相比,在大多数情况功效较高,表现稳定。对关于血脂的汇总数据进行分析,ATPC识别出很多被单性状关联分析遗漏的新SNPs。对显著关联的SNPs进行GO、KEGG与Reactome富集分析,许多SNPs被富集到与血脂性状相关的生物学通路。这些分析表明ATPC方法是有效的,计算效率高,具有实际应用价值。