首页|面向信息SNP选择的聚类算法

面向信息SNP选择的聚类算法

扫码查看
SNP数据在人类遗传病诊断与治疗中存在重要作用,但SNP原始数据存在大量冗余,因此需要选择出信息量大的SNP,完成SNP数据的降维.针对常用聚类算法应用到信息SNP选择时未考虑单个SNP与SNP子集之间相似度的问题,采用一种新的相似度度量方法,提出了一种改进的聚类算法K-MIGS,并将其应用到SNP选择中.K-MIGS算法解决了传统K-means不能挖掘出SNP位点与SNP子集之间的强相关性问题,并在医院提供的临床数据实验中表明,K-MIGS具有更高的非信息SNP子集重构度.最后使用支持向量机、决策树和神经网络对构造的SNP子集进行分类实验,对比K-means、特征加权K-means、ReliefF和MCMR,结果表明K-MIGS分类准确率和F1指标上提升了10%和15%,充分说明K-MIGS在信息SNP选择中具有更好的效果.
Clustering Algorithm for Information SNP Selection

邢斌、周从华、张付全、张婷、蒋跃明

展开 >

江苏大学计算机科学与通信工程学院 镇江 212013

无锡市精神卫生中心 无锡 214151

无锡市妇幼保健院 无锡 214002

无锡市第五人民医院 无锡 214073

展开 >

单核苷酸多态性 SNP选择 相似度度量 K-means

江苏省重点研发计划(社会发展)项目江苏省重点研发计划(社会发展)项目无锡市卫生计生委科研项目

BE2016630BE2017628z201603

2021

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2021.49(10)
  • 2