查看更多>>摘要:针对多元统计建模依赖大样本的关键限制性问题,提出了高阶导数处理结合向量空间角度量乘性误差校正的最小二乘回归方法,并建立了衰减全反射-傅里叶红外光谱(ATR-FTIR)酸值预测模型.以某风电机组96个润滑油样品为案例,基于电位滴定法酸值测定数据实现了ATR-FTIR光谱对酸值的直接校正预测.采用模拟双曲函数法(SH)得到精密且准确的四阶导数光谱,通过分离重叠区域,提高光谱选择性;从校正集(48个样本)中按照相关系数判断特征区域;选取酸值最高样本作为参比,以角度量转换、1/(1+tan(θ/2))作为光谱的度量关系,抑制ATR-FTIR中有效光程变化等因素引起的乘性误差.经过四阶导数结合角度量方法的有效预处理,变量数由1737降至8,条件数由1.85×1015 降至56.34,有效消除了共线性对最小二乘(OLS)法的影响.直接应用OLS回归,验证集47个样本的决定系数(R2)达到0.981,相对误差为-8.38%~8.22%,优于常用的偏最小二乘(PLS)方法(R2=0.865,相对误差为-27.82%~22.38%),有效的数据预处理显著提高了预测精度.为进一步验证样本数对模型的影响,将校正样本集压缩至25,验证集扩充至70.结果表明,此模型的变量数由1737降为8,条件数由3.88×1015 降至42.60,验证集的R2=0.972,相对误差为-10.80%~12.31%,较PLS方法(R2=0.724,相对误差为-34.26%~53.84%)改善更明显,表明本方法在更少的建模样本条件下依然具有较高的预测精度,同时对乘性误差干扰具有良好的抑制作用和鲁棒性.