计算机技术与发展2020,Vol.30Issue(12) :77-82.DOI:10.3969/j.issn.1673-629X.2020.12.014

语音情感识别中面向小数据集的CGRU方法

CGRU Method for Small Datasets in Speech Emotion Recognition

吴俊清 倪建成 魏媛媛
计算机技术与发展2020,Vol.30Issue(12) :77-82.DOI:10.3969/j.issn.1673-629X.2020.12.014

语音情感识别中面向小数据集的CGRU方法

CGRU Method for Small Datasets in Speech Emotion Recognition

吴俊清 1倪建成 1魏媛媛1
扫码查看

作者信息

  • 1. 曲阜师范大学 软件学院,山东 曲阜 273100
  • 折叠

摘要

为增强人机交互的和谐,提升语音情感识别的精度,提出一种面向小数据集的CGRU深度学习方法.该方法将原始音频通过上移和下移操作进行语音增强,将增强后的语音信号映射到Mel尺度并生成Mel功率谱图,然后对其做旋转、切角、偏移等图像增强操作,并结合卷积神经网络(CNN)对频域特征的捕捉能力和门控循环单元(GRU)网络对时序信息的特性获取能力构成融合模型CGRU,该模型通过自动学习深度谱特征进行情感识别.实验分别验证了利用谱图特征与手工特征在Emo-DB上的识别效果,并比较了CLSTM与CGRU的时间性能.结果表明,利用谱图特征在CGRU方法上的情感识别精度达到98.39%,超过传统手工特征eGeMAPS在该数据库上的识别效果,提出的方法在语音情感识别任务上获得有竞争力的表现.另外,在相同的训练参数下,CGRU要比CLSTM具有更加良好的时间性能.

关键词

语音情感识别/卷积神经网络/门控循环单元/小数据集/谱图特征

引用本文复制引用

基金项目

国家自然科学基金青年项目(61601261)

山东省研究生教育质量提升计划项目(SDYY17136)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量1
参考文献量5
段落导航相关论文