摘要
特征波段选择是近红外光谱分析的关键步骤之一,有效的特征波段选择能提高建模效率与模型性能.传统的特征波段选择算法存在运行时间长、选择特征冗余的缺陷,在实际工程应用中难以达到期望的效果.哈里斯鹰优化(HHO)算法具有原理简单、参数少的优点,但同时也存在收敛精度低且易陷入局部最优的不足.在HHO算法的基础上提出了一种基于改进哈里斯鹰优化(IHHO)算法的近红外光谱特征波段选择模型.针对HHO算法只能用于求解连续空间的优化问题,采用离散化策略对HHO算法进行修正,使其能求解离散形式的特征波段选择问题;考虑到HHO算法初始种群的质量差,使用混沌映射、反向学习提高初始种群的质量,以增强算法的全局探索能力;由于HHO算法在局部搜索时的收敛精度低,提出了新的猎物能量衰减模型与跳跃策略,以进一步增强算法在局部搜索时的寻优能力;为避免算法在寻优过程中落入局部最优,借鉴了遗传算法的变异方式对HHO算法进行扰动.使用竞争性自适应重加权采样法(CARS)、连续投影算法(SPA)、粒子群优化(PSO)算法、遗传算法(GA)、HHO算法与IHHO算法进行比较,并以4个定性分析近红外光谱数据集与2个定量分析近红外光谱数据集分别建立了支持向量机(SVM)识别模型和偏最小二乘回归(PLSR)模型.在定性分析实验中,IHHO算法得到的平均准确率相对于全波段时分别提高了0.83%、9.55%、17.65%以及0%,平均特征波段数仅占全波段的9.97%、2.59%、1.36%以及0.59%.在定量分析实验中,IHHO算法得到的平均决定系数分别较全波段提高了10.57%、1.47%、4.41%、3.66%以及3.06%,平均均方根误差分别较全波段较低了0.162、1.2663、1.868、1.8694以及0.4084,平均特征波段数仅占全波段的9.24%、10.53%、6.54%、6.91%以及7.14%.实验结果表明,IHHO算法在选择特征波段时能够去冗余,针对性选择最重要的特征波段,其性能均优于比较的几种算法.IHHO算法具有良好的应用前景.
基金项目
国家自然科学基金项目(62141501)
国家自然科学基金项目(62265003)
贵州省科技厅学术新苗培养及创新探索专项项目(GYU-KJT[2022])