近年来,公众健康问题成为人们关注的热点,体检数据和血清质谱数据都是通过血液样本得到的,如何快速从血液数据中获得想要的信息成为一个问题.质谱数据具有维度高,且各组数据维度不一致的特点,单靠人工难以从中提取并分析信息.随着数据挖掘中关联规则分析方法的不断进步,可以通过对血清数据进行数据挖掘找到血清之间的关联信息,从而快速得到血清数据分析结果.提出一种改进K⁃means算法,并用对数据进行聚类,聚类后的数据具有簇内差异小,簇间差异大的特点,能更好地对连续数据进行离散化,Apriori算法和FP⁃Growth算法分析得到血清质谱数据和体检数据关联规则,此关联规则可以验证血液检测结果的准确性,对于医学血液检测的发展有重大意义.