马力,现任喜马拉雅FM音视频高级工程师,从事过音视频嵌入式开发、移动端开发以及现在的深度学习研发,拥有个人开源项目Yasea,安卓音视频推流;目前从事基于Tacotron模型的语音合成技术(TTS)以及声码器(vocoder)研发。
视频介绍
语音合成(TTS)是语音AI平台的基础设施,而声码器就决定着其中的声学模型以及合成质量。本期分享我们邀请到了喜马拉雅FM音视频高级工程师 马力老师。此次,他将为大家介绍开源免费WORLD声码器的原理架构,并结合谷歌端到端Tacotron模型,演示中文语音合成的应用。