首页|基于Bi-GRU+BFE模型的短语音说话人识别

基于Bi-GRU+BFE模型的短语音说话人识别

扫码查看
说话人识别作为一种重要的生物特征识别技术,已得到广泛应用.由于实际应用中获取的说话人语音长度有限,如何提高语音特征的短时性能,使声纹识别在短语音上取得较高的准确率,仍然是一大难点.对此,论文研究了一种双向门控循环单元(Bidirectional-Gated Recurrent Unit,Bi-GRU)与块级特征均衡(Block-level Feature Equalization,BFE)结构相结合的说话人识别方法,通过循环神经网络结构将梅尔频率倒谱系数(MFCC)转化为包含短时说话人身份信息的深层时序特征,再结合交叉熵损失函数进行模型训练.实验结果表明,Bi-GRU+BFE模型在短语音说话人识别上取得了比传统的高斯混合模型及其他深度网络模型更高的识别率,训练效率也得到大幅度提高.
Speaker Recognition Under Short Utterance Based on Bi-GRU+BFE Model

姜珊、张二华、张晗

展开 >

南京理工大学计算机科学与工程学院 南京 210094

说话人识别 短语音 双向门控循环单元 块级特征均衡 梅尔频率倒谱系数

军委装备发展部装备预研领域基金(十三五)

61403120102

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(10)
  • 2
  • 5