首页|基于Tacotron模型和韵律修正的情感语音合成方法

基于Tacotron模型和韵律修正的情感语音合成方法

扫码查看
语音合成技术日趋成熟,为了提高合成情感语音的质量,提出了一种端到端情感语音合成与韵律修正相结合的方法.在Tacotron模型合成的情感语音基础上,进行韵律参数的修改,提高合成系统的情感表达力.首先使用大型中性语料库训练Tacotron模型,再使用小型情感语料库训练,合成出具有情感的语音.然后采用Praat声学分析工具对语料库中的情感语音韵律特征进行分析并总结不同情感状态下的参数规律,最后借助该规律,对Tacotron合成的相应情感语音的基频、时长和能量进行修正,使情感表达更为精确.客观情感识别实验和主观评价的结果表明,该方法能够合成较为自然且表现力更加丰富的情感语音.
Expressive Speech Synthesis Method Based on Tacotron Model and Prosodic Correction

张昕、胡航烨、曹欣怡、王蔚

展开 >

南京师范大学教育科学学院,南京 210097

语音合成 端到端合成 韵律修正 情感语音

国家哲学社会科学基金

BCA150054

2022

数据采集与处理
中国电子学会 中国仪器仪表学会信号处理学会 中国仪器仪表学会中国物理学会微弱信号检测学会 南京航空航天大学

数据采集与处理

CSTPCDCSCD北大核心
影响因子:0.679
ISSN:1004-9037
年,卷(期):2022.37(4)
  • 1
  • 4