摘要
为提高混响噪声下声源定位的精度和稳健性,提出多特征复合模型粒子滤波算法.该算法以麦克风接收信号的多特征构建似然函数,采用卷积神经网络提取多假设时延估计图像的深度特征,建立基于支持向量回归的时延估计模型;引入波束输出能量融合机制,弥补单特征不能同时抑制噪声和混响的缺陷.针对说话人运动随机性的问题建立声源跟踪的复合模型,改善说话人跟踪系统的鲁棒性.仿真和实测结果表明:在复合模型跟踪下,多特征算法比可控响应功率时延估计算法位置平均均方根误差减少83%以上;在多特征观测下,复合模型比郎之万模型和随机行走模型位置平均均方根误差减少46%以上;新算法实现了对复杂环境下随机运动声源的有效跟踪.