网络安全技术与应用2024,Issue(5) :58-61.

融合注意力机制的Res2Net-LSTM声纹识别方法

李坤明
网络安全技术与应用2024,Issue(5) :58-61.

融合注意力机制的Res2Net-LSTM声纹识别方法

李坤明1
扫码查看

作者信息

  • 1. 郑州警察学院 河南 450003
  • 折叠

摘要

针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法.通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重进行调整,通过关注重点区域,提高分类性能.在公开的Voxceleb1数据集上进行验证,实验结果表明,相较于ResNet-LSTM、Res2Net-LSTM准确率分别提升了10.4%,10.5%,验证了该方法具有更好的性能.

关键词

声纹识别/注意力机制/Res2Net/LSTM

引用本文复制引用

基金项目

中央高校基本科研业务费专项(2022TJJBKY026)

中央高校基本科研业务费专项(2022TJJBKY009)

出版年

2024
网络安全技术与应用
北京大学出版社

网络安全技术与应用

CHSSCD
影响因子:0.417
ISSN:1009-6833
参考文献量15
段落导航相关论文