当前播放

基于端到端TTS的音色克隆、风格迁移、歌声合成等衍生应用

分享者: 贺雯迪/喜马拉雅/音频算法工程师

爱丁堡大学人工智能硕士,喜马拉雅音频算法工程师。研发经历:TTS前端模块(文本正则、分词算法、韵律预测等),后端算法(基于深度生成模型VAE的说话人风格控制,音色转换,音色克隆、few-shot learning,神经声码器的优化等)。

视频介绍

现如今,随着TTS技术不断发展,用户对于语音合成的音质质量、流畅度等拥有更高追求。语音合成中的风格控制、音色转换、歌声合成等技术是目前业界的难点和共同追求的方向,其为现阶段语音合成提供了更优质的用户体验和满足不同场景需求。本演讲将讨论有效的算法及策略以实现更具生动、富有情感的语音合成表现。
还可输入800
全部评论
课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答