摘要
随着信息技术的飞速发展,语音合成技术越来越受到研究者的重视。随着各种新技术的出现与应用,特别是基音同步叠加算法的提出,使语音合成技术有了新的发展,语音合成的自然度和可懂度大大提高,并且进入产业化阶段。同时,人们对语音合成的质量提出了更高的要求,如何能让合成的语音更自然、更有表现力,特别是让合成语音表现丰富的情感色彩,是当前语音合成研究的热点,具有重要的理论价值和应用价值。 为了合成带情感的语音,本文设计并建立了实验用情感语音库,通过分析库中携带已知情感状态的语音,提取了表达情感特征的基频、时长和能量等韵律参数,将带情感的语音与不带任何情感的语音在韵律特征方面进行比较,得出情感转换的韵律参数规则。 接着,本文将最重要的情感特征参数--基频曲线作为工作的切入点,修改Fuiisaki模型的声调命令构件,建立适合汉语普通话的调型函数;提取不同情感下的语调,并将其与韵律参数修改规则相结合,实现了一种适合汉语情感语音基频建模的方法。 最后,本文采用基音同步叠加算法来合成语音,根据输入文本的拼音,从声母库中选择带过渡段的声母,从韵母库中提取基音同步模板进行基音同步,根据声调及二字词变调规则确定调型,将声韵母拼接,调整韵律,合成带声调的单字音节,进而合成整个不带任何情感的句子。最后根据所选的情感状态,调整句子的语调,得到情感语音。