赞
踩
Question1: vocoder在合成中的角色???
语音合成主要有波形拼接和参数合成两种方法[1]。
使用原始语音波形替代参数,合成的语音清晰自然,质量相比于参数合成方法要好。PSOLA(pitch synchronous overlap add)算法可以对拼接单元的韵律特征进行调整。
提取参数->HMM建模->合成参数->波形重建
合成中的vocoder的作用主要是:提取语音信号的相关参数;根据相关参数合成出最终的语音。一些vocoder[2]如下:
WORLD是基于vocoder的语音合成工具
Question2: vocoder为什么可以用以上的三个参数来进行语音合成???
上图基于人发声机理的经典源-滤波器(source-filter)模型,其中源激励部分对应于肺部的气流和声带共同作用形成的激励,声道谐振部分对应于声道的调音运动。
两种建模方法:
声带激励分为两类,可以产生清音(/p/ /b/)或者浊音(/m/ /a/)。辅音有清有浊,而多数语言中元音均为浊音。
上面的二元激励模型将复杂的产生激励过程简单的划为两部分,大大简化了声门激励的特征,但是合成语音的自然度较低。
STRAIGHT引入了混合激励,浊音激励由分别通过高低通滤波器的随机噪声序列和脉冲序列相加,清音的激励源由噪声序列叠加一个位置随机的正脉冲并跟随一个负脉冲构成的脉冲对形成的爆破脉冲。[3]
混合激励可以通过aperiodicity来控制浊音段中的周期激励和噪声成分的相对比重
[1].《语音信号处理》 韩纪庆
[2].WORLD: a vocoder-based high-quality speech synthesis system for real-time applications
[3].基于STRAIGHT 分析的高效语音合成算法研究
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。