当前播放

高效端上机器视觉系统开发与优化频编码技术的相关项目。

分享者: 汪启扉/谷歌研究院/资深研究软件工程师

汪启扉博士目前作为资深研究软件工程师供职于Google研究院。他主要负责移动端机器视觉方面的研究和系统开发。他的工作被广泛应用于Google产品中,包括Android Camera, Google Lens, Android ML Kit等。在加入Google之前,他曾于清华大学自动化系获得控制科学与工程博士学位。其博士研究内容主要包括立体视频压缩域传输。他曾先后担任微软亚洲研究院助理研究研员和加州大学伯克利分校博士后研究员。他主要的研究兴趣包括移动端计算机视觉与机器学习前沿研究以及高效系统的开发。

视频介绍

演讲座主要包括介绍最新Google发布端上机器视觉开发工具,包括TFLite视觉任务API、开源MediaPipe系统、ML Kit开发包等,以及实战开发经验。同时还包括端上机器视觉未来发展方向,例如硬件加速下的深度学习以及端上多任务学习等等。对端上计算机视觉和机器学习感兴趣的系统开发人员,应用开发人员以及研究人员将通过此次分享了解端上机器视觉系统和应用的开发方法,而无需具备专业深度学习理论。此外,听众还可以了解到未来端上机器视觉的发展方向。
还可输入800
全部评论
课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答