LiveVideoStack » 基于端到端TTS的音色克隆、风格迁移、歌声合成等衍生应用

当前播放

爱丁堡大学人工智能硕士，喜马拉雅音频算法工程师。研发经历：TTS前端模块（文本正则、分词算法、韵律预测等），后端算法（基于深度生成模型VAE的说话人风格控制，音色转换，音色克隆、few-shot learning，神经声码器的优化等）。

技术标签： LiveVideoStackCon 2020线上峰会

现如今，随着TTS技术不断发展，用户对于语音合成的音质质量、流畅度等拥有更高追求。语音合成中的风格控制、音色转换、歌声合成等技术是目前业界的难点和共同追求的方向，其为现阶段语音合成提供了更优质的用户体验和满足不同场景需求。本演讲将讨论有效的算法及策略以实现更具生动、富有情感的语音合成表现。

全部评论

课程推荐