现代计算机2022,Vol.28Issue(11) :25-30.DOI:10.3969/j.issn.1007-1423.2022.11.004

基于融合频域和时域特征的说话人识别

Speaker Recognition Based on Fusion of Frequency Domain and Time Domain Features

龙翔 夏秀渝
现代计算机2022,Vol.28Issue(11) :25-30.DOI:10.3969/j.issn.1007-1423.2022.11.004

基于融合频域和时域特征的说话人识别

Speaker Recognition Based on Fusion of Frequency Domain and Time Domain Features

龙翔 1夏秀渝1
扫码查看

作者信息

  • 1. 四川大学电子信息学院,成都 610065
  • 折叠

摘要

针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维.降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练.仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高.

关键词

说话人识别/融合特征参数/MFCC/GFCC/神经网络

引用本文复制引用

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
参考文献量6
段落导航相关论文