摘要
高通量测序技术的发展推动了人类基因组数据的分析与挖掘,数据质量评估又直接影响了数据分析的准确性.学术界和工业界提出了大量的质量评估方法和工具,然而,获得全面的数据质量评估指标需结合多个工具,这个过程常面临评估流程难以重复、数值不稳定、自动化程度低、计算时间长等问题.因此,为使评估流程变得简单高效,文章开发了一个基于Nextflow工作流管理系统的数据评估管道,并结合容器技术(Docker)和集群容器管理技术(Kubernetes),以提高管道的可移植性和可扩展性.该管道分别在单机和集群中进行测试,结果表明:管道在集群中能够显著降低运算时间,在高并发时有更好的性能.