查看更多>>摘要:[目的]在经常处理高维数据集的大数据时代中,特征选择是至关重要的.黏菌算法(slime mould algorithm,SMA)因其简单高效而被广泛应用于特征选择领域,并得到改进.然而,现有改进大多局限于策略添加和算法混合,未根据特征选择问题的特点进行深入改进.为此,本文提出了一种基于改进SMA(improved SMA,ISMA)的特征选择方法.[方法]首先,针对在特征选择时适应度函数值域较小导致的SMA全局探索和局部开发能力不平衡的问题,修改决定黏菌位置更新方式的参数;其次,针对SMA倾向往原点方向收敛的问题,改进SMA的位置更新公式;最后,针对SMA容易陷入局部最优的问题,提出一种基于均衡池改进黏菌位置更新公式的方法.进一步选取Musk1数据集和Lymphography数据集对比ISMA和SMA的全局探索和局部开发能力,并选取11个UCI数据集评价ISMA的性能.[结果]与SMA相比,ISMA具有更强的全局探索能力和局部开发能力,能够很好地平衡探索与开发.与SMA、GA和BGWO1等8种算法相比,ISMA在提高模型分类性能和降低特征维度上均有一定的竞争力.从平均分类准确率的角度看,与SMA相比,ISMA在所有数据集上均优于SMA,平均分类准确率最高提升6.53个百分点.与其他对比算法相比,ISMA在9个数据集上取得最优的平均分类准确率,而在剩下的2个数据集上也取得了次优的平均分类准确率,与第一名仅分别相差0.19个百分点和0.05个百分点,同时其平均维度缩减率均优于第一名.从平均维度缩减率的角度看,ISMA在2个数据集上取得最优的维度缩减率,总体表现良好.[结论]本文提出的基于ISMA的特征选择方法具有更高的泛化性能,与其他元启发式特征选择算法相比也有一定的优势.