当前播放

开源声码器WORLD在语音合成中的应用

分享者: 马力/喜马拉雅FM/音视频工程师

马力,现任喜马拉雅FM音视频高级工程师,从事过音视频嵌入式开发、移动端开发以及现在的深度学习研发,拥有个人开源项目Yasea,安卓音视频推流;目前从事基于Tacotron模型的语音合成技术(TTS)以及声码器(vocoder)研发。
技术标签: 语音合成

视频介绍

语音合成(TTS)是语音AI平台的基础设施,而声码器就决定着其中的声学模型以及合成质量。本期分享我们邀请到了喜马拉雅FM音视频高级工程师 马力老师。此次,他将为大家介绍开源免费WORLD声码器的原理架构,并结合谷歌端到端Tacotron模型,演示中文语音合成的应用。
还可输入800
全部评论
课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答