首页|基于DNA微阵列数据的肿瘤基因选择技术研究

基于DNA微阵列数据的肿瘤基因选择技术研究

吴邦语

基于DNA微阵列数据的肿瘤基因选择技术研究

吴邦语1
扫码查看

作者信息

  • 1. 南昌工程学院
  • 折叠

摘要

统计数据表明,癌症是导致人类寿命缩短的主要原因。随着DNA微阵列技术的不断发展,越来越多的微阵列数据在不同领域的应用进入了快速发展阶段。利用机器学习技术处理微阵列基因表达谱数据对癌症的分型诊断和治疗体现出越来越重要的价值。然而,微阵列数据具有的超高维、小样本、样本分布不均匀的特点,使得利用机器学习技术处理这类数据带来挑战。本文针对微阵列数据集的特点,以提高肿瘤识别精度为目的,聚焦于基因选择技术的研究,本文的主要内容如下: (1)提出了一种基于XGBoost和灰狼优化算法的混合基因选择方法XGBoost-GWO。首先对微阵列表达谱数据集进行归一化和缺失值处理,用训练集均值代替缺失值;然后使用XGBoost算法对基因进行排序,去除不相关的基因子集。最后,进一步使用灰狼优化算法从筛选后的基因集合中搜索最优基因子集。实验采用两种知名的学习分类器对微阵列数据库中的十一种不同微阵列基因表达谱数据,包括淋巴癌、乳腺癌和结肠癌等进行实验研究,实验结果表明提出的XGBoost-GWO算法在十一种微阵列数据集上明显优于现有的所有基因选择方法,能够大大提升预测性能。 (2)提出了一种基于ReliefF和多目标遗传算法MOGA的基因选择算法RMOGA。RMOGA基因选择方法包含三步。首先,对微阵列数据进行缺失值处理和最大最小归一化处理。其次,使用ReliefF算法过滤掉大量不相关的特征。最后利用多目标遗传算法MOGA选择最优的基因子集。本文对十一个肿瘤基因表达谱数据集进行了大量的实验,将RMOGA与其他先进算法进行比较。采用朴素贝叶斯和支持向量机两种经典分类器来衡量所有比较方法的分类性能。实验结果表明,RMOGA算法可以搜索到一个紧凑的基因子集且具有良好的分类性能和较高的计算效率。

关键词

肿瘤基因选择技术/微阵列基因数据/多目标遗传优化/灰狼优化

引用本文复制引用

授予学位

硕士

学科专业

电子信息

导师

黎敏/陈克绪

学位年度

2023

学位授予单位

南昌工程学院

语种

中文

中图分类号

R73
段落导航相关论文