电声技术2021,Vol.45Issue(6) :18-24.DOI:10.16311/j.audioe.2021.06.005

一种密集卷积神经网络的电视语音响度补偿方法

A Densely Connected Convolutional Networks for Speech Loudness Compensation of TV Program

谢仁礼 秦宇 罗雪倩
电声技术2021,Vol.45Issue(6) :18-24.DOI:10.16311/j.audioe.2021.06.005

一种密集卷积神经网络的电视语音响度补偿方法

A Densely Connected Convolutional Networks for Speech Loudness Compensation of TV Program

谢仁礼 1秦宇 1罗雪倩1
扫码查看

作者信息

  • 1. 深圳TCL新技术有限公司,广东 深圳 518071
  • 折叠

摘要

现有的电视语音响度补偿是针对人耳听阈和听力障碍的损失进行均衡补偿,这类方法会放大同频段的非人声.针对这类方法的缺陷,提出利用深度学习语音增强技术将人声从电视节目音频中分离出来,使用户直接听到清晰人声.对此提出密集连接卷积网络(Densely Connected Convolutional Network,DenseNet)结合卷积神经网络编解码器(Convolutional Encoder-Decoder,CED)结构的新型神经网络语音增强模型.该模型量级较轻,能够在电视上实时运行,与同量级网络参数的卷积神经网络(Convolutional Neural Networks,CNN)语音增强模型相比,效果更好且模型更小.

关键词

密集连接卷积神经网络/卷积编解码器/实时语音增强/残差连接

引用本文复制引用

出版年

2021
电声技术
电视电声研究所(中国电子科技集团公司第三研究所)

电声技术

影响因子:0.259
ISSN:1002-8684
参考文献量18
段落导航相关论文