基于韵律特征的汉语普通话情感语音分析与合成

李娜¹

扫码查看

作者信息

1. 南开大学
折叠

摘要

随着信息技术的飞速发展,语音合成技术越来越受到研究者的重视。随着各种新技术的出现与应用,特别是基音同步叠加算法的提出,使语音合成技术有了新的发展,语音合成的自然度和可懂度大大提高,并且进入产业化阶段。同时,人们对语音合成的质量提出了更高的要求,如何能让合成的语音更自然、更有表现力,特别是让合成语音表现丰富的情感色彩,是当前语音合成研究的热点,具有重要的理论价值和应用价值。为了合成带情感的语音,本文设计并建立了实验用情感语音库,通过分析库中携带已知情感状态的语音,提取了表达情感特征的基频、时长和能量等韵律参数,将带情感的语音与不带任何情感的语音在韵律特征方面进行比较,得出情感转换的韵律参数规则。接着,本文将最重要的情感特征参数--基频曲线作为工作的切入点,修改Fuiisaki模型的声调命令构件,建立适合汉语普通话的调型函数；提取不同情感下的语调,并将其与韵律参数修改规则相结合,实现了一种适合汉语情感语音基频建模的方法。最后,本文采用基音同步叠加算法来合成语音,根据输入文本的拼音,从声母库中选择带过渡段的声母,从韵母库中提取基音同步模板进行基音同步,根据声调及二字词变调规则确定调型,将声韵母拼接,调整韵律,合成带声调的单字音节,进而合成整个不带任何情感的句子。最后根据所选的情感状态,调整句子的语调,得到情感语音。

关键词

情感语音合成/基频曲线/Fujisaki/模型/基因同步叠加算法

引用本文复制引用

授予学位

硕士

学科专业

计算机软件与理论

导师

朱耀庭

学位年度

2010

学位授予单位

南开大学

语种

中文

中图分类号

段落导航