计算机技术与发展2023,Vol.33Issue(6) :47-53,60.DOI:10.3969/j.issn.1673-629X.2023.06.008

说话人重识别中的基频和共振峰联合还原方法

Joint Restoration of Pitch and Formant for Speaker Re-recognition

魏春雨 孙蒙 贾冲
计算机技术与发展2023,Vol.33Issue(6) :47-53,60.DOI:10.3969/j.issn.1673-629X.2023.06.008

说话人重识别中的基频和共振峰联合还原方法

Joint Restoration of Pitch and Formant for Speaker Re-recognition

魏春雨 1孙蒙 1贾冲1
扫码查看

作者信息

  • 1. 陆军工程大学 指挥控制工程学院,江苏 南京 210007
  • 折叠

摘要

说话人匿名技术的出现,对基于声纹的生物特征识别造成了巨大的安全威胁.对于利用各种变声工具实施的说话人匿名,匿名语音中的说话人个性特征相比原始语音发生了显著改变,会严重影响说话人识别的效果.针对现有说话人重识别方法存在的语音还原手段单一、在变声工具类型未知情况下的匿名语音还原效果尚不明确等问题,提出了一种基于基频和共振峰联合还原的说话人变声匿名重识别方法.该方法在基频逆变换变声还原的基础上,引入McAdams系数调整语音的共振峰,同时使用基于x-vector的说话人识别模型进行声纹相似度评分,提高了黑盒变声匿名条件下还原语音与真实语音的声学特征相似度,增强了说话人识别系统对不同类型变声匿名语音的重识别能力.实验结果表明,提出的方法对四种音频编辑软件和三种真实变声器材匿名语音的重识别效果均优于现有基线重识别方法.

关键词

说话人匿名/说话人重识别/McAdams系数/共振峰/还原

引用本文复制引用

基金项目

国家自然科学基金(62071484)

江苏省自然科学基金(BK20180080)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量3
段落导航相关论文