首页|基于CNN+LSTM的藏语语音去噪算法

基于CNN+LSTM的藏语语音去噪算法

扫码查看
本文主要研究藏语语音去噪算法,提出一种基于频谱映射的卷积长短期记忆藏语语音去噪算法.该算法由数据准备模块、特征提取模块、网络模块以及音频还原模块4个模块组成,以纯净的拉萨语语音和加了噪声库NOISE-92六种单一噪声的带噪语音作为数据集,提取带噪语音和纯净语音的对数功率谱特征作为输入对网络进行训练,网络的效果通过可感知语音质量和短时客观可懂度两个指标进行评价.实验结果表明,该算法在非平稳噪声上的去噪效果优于平稳噪声,且信噪比越大其去噪效果越好;在低信噪比下,该算法在非平稳噪声上的表现优于谱减法和最小均方误差法.
Tibetan Speech Denoising Algorithm Based on CNN+LSTM

王君堡、王希、边巴旺堆

展开 >

西藏大学 信息科学技术学院,西藏 拉萨 850000

西藏大学 信息技术国家级实验教学示范中心,西藏 拉萨 850000

藏语去噪 对数功率谱 卷积长短期记忆网络

2022

电声技术
电视电声研究所(中国电子科技集团公司第三研究所)

电声技术

影响因子:0.259
ISSN:1002-8684
年,卷(期):2022.46(6)
  • 6