典型多说话人语音自动分割算法研究

陆思宇 ¹姜囡²

扫码查看

作者信息

1. 中国刑事警察学院
2. 中国刑事警察学院;证据科学教育部重点实验室(中国政法大学)
折叠

摘要

针对多说话人涉案语音的检验处理,常需要人工将多说话人语音分为若干个单一说话人语音片段,逐一在长时语音段中寻找语音分割点,从而严重影响检验人员的工作效率.利用说话人语音分割技术可以自动高效寻找出语音段中目标说话人语音转换点,有效提升办案时效.分别选取BIC分割算法、基于Ecapa-tdnn声纹模型的左右窗分割算法、基于Bi-Istm的二分类窗分割算法以及固定窗分割算法,针对不同种类噪声的含噪语音进行语音自动分割的差异性分析.结果表明,左右窗和二分类窗分割算法具有良好的分割准确性和抗噪性,BIC和固定窗的非监督式分割算法在处理速度上具有明显优势.本文的分析结果可为多说话人涉案语音预处理方法选择上提供有效的数据和理论依据.

关键词

说话人语音分割/语音预处理/低信噪比/贝叶斯准则/声纹模型

引用本文复制引用

基金项目

公安学科基础理论研究创新计划项目(2022XKGJ0110)

辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目(2020-KF-12-11)

证据科学教育部重点实验室开放基金资助课题(2021KFKT09)

中央高校基本科研业务费专项资金资助(3242019010)

辽宁省自然科学基金项目(2019-ZD-0168)

教育部重点研究项目(E-AQGABQ20202710)

出版年

2024

警察技术

公安部第一研究所

警察技术

影响因子：0.386

ISSN：1009-9875

参考文献量16

段落导航