首页|典型多说话人语音自动分割算法研究

典型多说话人语音自动分割算法研究

扫码查看
针对多说话人涉案语音的检验处理,常需要人工将多说话人语音分为若干个单一说话人语音片段,逐一在长时语音段中寻找语音分割点,从而严重影响检验人员的工作效率.利用说话人语音分割技术可以自动高效寻找出语音段中目标说话人语音转换点,有效提升办案时效.分别选取BIC分割算法、基于Ecapa-tdnn声纹模型的左右窗分割算法、基于Bi-Istm的二分类窗分割算法以及固定窗分割算法,针对不同种类噪声的含噪语音进行语音自动分割的差异性分析.结果表明,左右窗和二分类窗分割算法具有良好的分割准确性和抗噪性,BIC和固定窗的非监督式分割算法在处理速度上具有明显优势.本文的分析结果可为多说话人涉案语音预处理方法选择上提供有效的数据和理论依据.

陆思宇、姜囡

展开 >

中国刑事警察学院

证据科学教育部重点实验室(中国政法大学)

说话人语音分割 语音预处理 低信噪比 贝叶斯准则 声纹模型

公安学科基础理论研究创新计划项目辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目证据科学教育部重点实验室开放基金资助课题中央高校基本科研业务费专项资金资助辽宁省自然科学基金项目教育部重点研究项目

2022XKGJ01102020-KF-12-112021KFKT0932420190102019-ZD-0168E-AQGABQ20202710

2024

警察技术
公安部第一研究所

警察技术

影响因子:0.386
ISSN:1009-9875
年,卷(期):2024.(2)
  • 16