基于小型麦克风阵列的声源定位系统设计与实现

李扬¹

扫码查看

作者信息

1. 哈尔滨工业大学
折叠

摘要

基于麦克风阵列的声源定位技术是音频处理领域的一个重要分支，广泛应用于会议系统、车载电话和枪炮定位等领域。麦克风阵列有大型与小型之分，本文主要研究内容是基于小型麦克风阵列设计和实现一个实时的室内声源定位系统。时延估计技术是一种主流的基于麦克风阵列的声源定位技术，它原理简单且实现方便，被广泛应用于声源定位系统中。在基于时延估计技术的声源定位系统中，定位过程主要分为时延估计（Time Delay Estimation, TDE）和定位两个阶段，声源定位结果的好坏与这两个阶段的效果紧密相关：时延值估计的误差由于双曲面的几何特性在定位阶段被放大，造成定位阶段成功率不高，定位结果误差较大。在TDE阶段，本文研究并实现一些常见的TDE算法；给出了TDE阶段的一些优化方法如时延值插值、时延值筛选和时延值偏移补偿等；AED（Adaptive Eigenvalue Decomposition）是一种TDE算法，本文对其进行了改进以提高TDE阶段的成功率和精确度。在定位阶段，针对传统几何位置定位法在近场定位中的缺点，给出了基于时延值冗余的定位算法。此外，设计了麦克风模块，结合数据采集卡搭建了声源定位系统的硬件平台；研究并实现音频信号的预处理，针对拍掌声源给出一种有效帧检测的优化策略。本文还基于仿真平台对 SRP-PHAT（Steered Response Power with the Phase Transform）进行研究和实现，并验证其可行性。本文采用半径为25 cm的四元十字麦克风阵列，利用数据采集卡的40 kHz采样率，结合上述优化和改进的方法，最终实现一个基于麦克风阵列的室内实时声源定位系统。本文基于该系统进行了各阶段的对比实验，验证了上述改进和优化方法的优越性。实验结果表明，该系统可得到较高的声源方位角估计精度，除了某些特殊区域之外也能得到较好的距离估计效果，而且基本能满足室内定位的实时性要求。

关键词

声源定位系统/麦克风阵列/时延估计/优化策略

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

王鸿鹏

学位年度

2014

学位授予单位

哈尔滨工业大学

语种

中文

中图分类号

段落导航