国家学术搜索
登录
注册
中文
EN
首页
|
基于融合频域和时域特征的说话人识别
基于融合频域和时域特征的说话人识别
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维.降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练.仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高.
外文标题:
Speaker Recognition Based on Fusion of Frequency Domain and Time Domain Features
收起全部
展开查看外文信息
作者:
龙翔、夏秀渝
展开 >
作者单位:
四川大学电子信息学院,成都 610065
关键词:
说话人识别
融合特征参数
MFCC
GFCC
神经网络
出版年:
2022
DOI:
10.3969/j.issn.1007-1423.2022.11.004
现代计算机
中大控股
现代计算机
影响因子:
0.292
ISSN:
1007-1423
年,卷(期):
2022.
28
(11)
参考文献量
6