摘要
包装器特征选择是一种数据预处理方法,通过筛选出信息量最大的特征来降低原始数据集的维数,同时使分类特征的精度最大化.为提高包装器特征选择能力,提出了一种混合人工化学反应狼群优化算法——ACR-WCA.ACR-WCA算法采用自然策略,模仿狼群的搜索策略,可以快速向解空间靠拢,再采用人工化学反应策略优化狼群的种群行为,快速找到最优解,解决局部最优问题;其次,为有效处理数据特征,在初始化阶段利用转换函数处理成二进制特征问题;之后,结合分类准确率和特征选择数给出算法的适应度函数.同时,采用k最近邻(KNN)分类器对测试数据进行训练,并通过K-折交叉验证来克服过拟合问题.实验基于21个著名的不同维度数据集训练,并与4种传统方法和3种接近方法进行比较.实验结果表明,该算法是高效可靠的,它可以对大量特征进行分类任务,具有较高的准确率.
基金项目
国家自然科学基金(61762092)
云南省软件工程重点实验室开放基金(2017SE204)
云南省重大科技专项(202002AB080001)
《材料基因工程-基于Metcloud的集成计算功能模块计算软件开发》(2019CLJY06)