语音合成技术已进入人们的日常生活:有声阅读、智能客服、智能家居等场景都已经出现了“它”的身影。 声音的可用性,可以通过自然度、可懂度、识别度等维度来考量。语音技术的进步,让机器合成的声音不再顿挫、冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还存在不足。声音如果缺少情感,何谈表现力 ,又如何能提高用户交互的意愿?
李秀林
语音合成 WaveNet 标贝科技, 李秀林, 音视频,
语音合成(TTS)是语音AI平台的基础设施,而声码器就决定着其中的声学模型以及合成质量。本期分享我们邀请到了喜马拉雅FM音视频高级工程师 马力老师。此次,他将为大家介绍开源免费WORLD声码器的原理架构,并结合谷歌端到端Tacotron模型,演示中文语音合成的应用。
马力
语音合成 喜马拉雅FM,
紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答