当前播放
基于端到端TTS的音色克隆、风格迁移、歌声合成等衍生应用
爱丁堡大学人工智能硕士,喜马拉雅音频算法工程师。研发经历:TTS前端模块(文本正则、分词算法、韵律预测等),后端算法(基于深度生成模型VAE的说话人风格控制,音色转换,音色克隆、few-shot learning,神经声码器的优化等)。
视频介绍
现如今,随着TTS技术不断发展,用户对于语音合成的音质质量、流畅度等拥有更高追求。语音合成中的风格控制、音色转换、歌声合成等技术是目前业界的难点和共同追求的方向,其为现阶段语音合成提供了更优质的用户体验和满足不同场景需求。本演讲将讨论有效的算法及策略以实现更具生动、富有情感的语音合成表现。