首页|基于深度卷积网络和谱图的语音情感识别

基于深度卷积网络和谱图的语音情感识别

扫码查看
针对弥合语音信号与主观情绪之间的情感鸿沟,传统的方法没有足够的区分度来描述主观情绪,特征提取效果并不理想.因此提出了一种基于卷积神经网络和谱图来对语音情感进行识别的方法,通过语音信号生成相关的对数Mel谱图,输入到深度卷积网络模型中,且该模型主要是由三个卷积层和两个完全连接层所构成,谱图通过模型训练提取相关特征并输出七种预测结果.实验结果表明,基于新训练好的模型在特征提取上优于传统的方法,大部分情绪预测的准确率能达到65%,与之前相比,提高了大约10%,所以该方法能够以在语音情感的识别上取得了不错的效果.
Speech Emotion Recognition from Spectrograms with Deep Convolutional Neural Network

张家铭、王晓曼、景文博

展开 >

长春理工大学 电子信息工程学院,长春 130022

长春理工大学 光电工程学院 长春 130022

卷积神经网络 语音情感识别 特征提取

吉林省科技厅项目吉林省科技厅项目国家科技部项目

20160204009GX20170623004TC2018YFB1107600

2020

长春理工大学学报(自然科学版)
长春理工大学

长春理工大学学报(自然科学版)

CSTPCD
影响因子:0.432
ISSN:1672-9870
年,卷(期):2020.43(1)
  • 4