对话沐曦 AI 解决方案总监虞新阳:不断迭代创新方能从市场中胜出

2023年3月27日

沐曦首款异构 GPU 产品 MXN100 已于 2022 年底实现规模量产,并与多家重点行业客户及服务器厂商联合打造应用落地解决方案,展开深度的生态合作。在过去很长一段时间里,GPU 市场一直被国外知名企业所主导,近些年来,随着中国经济的不断发展,国家对芯片领域的大力支持,国内涌现出了众多 GPU 芯片公司,而沐曦就是其中之一。

自 2020 年 9 月成立,沐曦就致力于打造全栈 GPU 芯片产品,目前推出的 MXN 系列 GPU(曦思)用于 AI 推理,MXC 系列 GPU(曦云)用于 AI 训练,以及 MXG 系列 GPU(曦彩)用于图形渲染,满足数据中心对 “高能效” 和 “高通用性” 的算力需求。

近日,LiveVideoStack 就采访到了沐曦 AI 解决方案总监虞新阳,请他来跟大家聊聊沐曦推出的通用 GPU 芯片产品、沐曦所具备的独特优势、以及他在沐曦工作的美好体验和收获。此外,他还与我们畅谈了国产 GPU 的未来发展以及他自己的 GPU 研发之路。对于想要进入芯片领域工作的年轻人,他也给出了十分中肯的建议。

图片

虞新阳 沐曦 AI 解决方案总监

虞新阳,沐曦 AI 解决方案总监。11 年 GPU 研发经验,8 年 AI 算法经验,参与并主导过国际旗舰厂商解码器、多页表多进程支持、智能调度等 GPU 功能的研发;参与并主导过阿里巴巴 3D 智能家装、内容推荐等 AI 算法的研发;在 ICDE、CVPR 等发表过多篇 paper。目前在沐曦负责 AI 算法。

文 / 虞新阳

策划、编辑  / Alex

研发之路

LiveVideoStack:虞老师,跟我们聊聊您的 GPU 之路吧,您最初是如何开始 GPU 研发工作的?

虞新阳:2007 年硕士毕业后,我加入了 S3 Graphic(S3 是上世纪 90 年代很领先的 2D 显卡公司),它是国内最早几家搭建完整 GPU 设计研发团队的公司之一,包括架构、硬件、软件、系统及解决方案等所有核心部门。从在架构部门学习、维护资深员工的代码开始,慢慢到优化 RISC core 的功能性能仿真器、汇编器,再到开始撰写 GPU 解码模块的架构设计文档,我对 GPU 的硬件模块(特别是解码器)定义和建模流程逐步有了很深的认识;另一方面,也需要用 GPU 3d shader 搭建 H264 编码雏形,使我加深了对 GPU 并行编程及架构的理解。

LiveVideoStack:在您过去所做的工作中,您认为其中哪些工作最令您感到满意?

虞新阳:在过去 16 年的工作历程中,一方面工作内容有较强相关性,同时也是比较有跨度的。2012 年在国际知名 GPU 公司,我负责设计研发了第一代统一的多标准解码器,它融合了内部两种不同的解码器架构,第一次在细粒度的宏块层面进行 GPU 解码和流水处理,在提升性能的同时也简化了解码方案。2014 年,比特币还处在较早期的发展阶段,慢慢地从 CPU 挖矿逐渐转移到 GPU 挖矿中,当时的显卡在挖矿程序上最初表现不太理想,后来我与团队一起定位出性能瓶颈在 MMU 模块上,协同思考研发了新的 MMU 架构,可以同时高效支持 4KB、64KB 和 2MB 的 GPU 页面,在硬件层面解锁了 GPU 的挖矿性能。2020 年在国内头部互联网公司,我主导设计了第一款端到端的智能家装设计轻应用,用户上传或选择户型图,30 秒就能得到可漫游的 3D 室内家装设计方案,虽然没有取得很大的成功,但为后面的迭代奠定了坚实的基础。以上几个点,现在回过头来想想,都还是挺有意义的。

LiveVideoStack:在接下来的工作中,您又将解决哪些难题?

虞新阳:当前我在沐曦的 AI 解决方案部门,主要负责 AI 算法。AI 是一种工具,就像 Python,C++ 等程序一样,只是它更高阶、更智能。一方面它能够解决外在应用场景中的问题,譬如视频的智能处理;另一方面也能解决 GPU 研发相关的内部问题。当前是视频化的时代,影视剧、视频聊天、短视频、直播等发展迅速,视频日益成为人类社会的主要信息载体。视频处理,特别是高效的视频压缩技术,一直是学术界和工业界努力的一个重点;结合 AI,我们也正在做一些学习、探索、实践及落地的工作。

LiveVideoStack:对于想进入芯片领域工作的年轻技术人,您有哪些建议送给他们?

虞新阳:现在的芯片公司一般都是计算平台型公司,需要各种各样的人才,包括硬件设计、软件开发以及人工智能算法等等。其中,IC 设计、操作系统、驱动、编译器等是芯片领域非常需要但总体偏小众的方向。一方面,年轻人可以特别关注这些领域需要的技术,譬如可以从嵌入式系统上的性能优化出发;另一方面,更重要的是培养自己的学习能力、专注能力、创新能力等,有了这些底层能力,一旦进入芯片领域的环境氛围,即使没有太多经验,也能够很快成长起来。

走近沐曦

LiveVideoStack:2022 年年底,沐曦首款异构 GPU 产品已规模量产。您能否向我们介绍一下这款产品以及它的应用场景?您在其中做了哪些工作?

虞新阳:这款产品拥有强大的 AI 算力和视频编解码能力,结合优秀的推理引擎以及 profiling 工具等软件栈,可以方便快捷地部署到数据中心或各种边缘服务器场景。总体来说,它特别适合在安防、智能视频平台、云游戏、云桌面、远程医疗、在线教育等领域发挥作用。

AI 解决方案团队当前着力于抽象一些重要的应用场景,譬如视频的智能转码。既可以给用户提高基础的解决方案作为参考设计,也能够协同推进整个软件栈的完善和优化。

LiveVideoStack:公开的资料显示,沐曦有三大 GPU 产品线:MXN(曦思),MXC(曦云)和 MXG(曦彩),分别用于 AI 推理、AI 训练及通用计算和图形渲染。在您看来,这三大产品在技术挑战、生态系统建设难度与潜在客户购买力方面有何异同?沐曦未来的主力产品有哪些?

虞新阳:GPU 现在已经广泛应用在各行各业,譬如游戏娱乐、搜索推荐、智慧城市等,并且向着更广更深的领域继续探索尝试,如自动驾驶、生物医疗、元宇宙等。

MXN、MXC 和 MXG 都是 GPU 产品线,有较强的计算能力和 AI 能力等, 但它们又有各自的侧重。MXN 侧重在推理,对应于比较成熟的应用部署落地场景;MXC 有很强的通用计算能力和训练能力,更加适用于数据中心以及应用的研发过程,譬如自动驾驶算法训练迭代;MXG 额外带有图形渲染能力,适用于元宇宙、游戏等场景。

去年年底面向推理的 MXN100 已成功实现规模量产,今年将迎来功能更强大的 MXC500 训练及通用计算芯片。

LiveVideoStack:近些年国内出现了很多芯片设计公司,与其他公司相比,沐曦具备哪些独特的优势?

虞新阳:沐曦成立两年多以来,发展很快,也很稳健。当前总部在上海,并在北京、杭州、南京、成都、深圳、武汉等地成立子公司暨研发中心;三大产品线 MXN/MXC/MXG 都在有条不紊地推进。都说一个公司的基因和核心创始团队息息相关,总结来看,沐曦在这几方面拥有较独特的优势:

首先,创始人都有很深的 GPU 研发背景,平均 20 年 GPU 领域工作经验,且成功领导过多代世界一流的 GPU 研发,有研发迭代的大局观;

其次,创始团队曾经有过紧密的相互合作经历,彼此配合默契,团队建制完整;

最后,公司整体拥有良好的工作环境和氛围,尊重知识,尊重人才。

GPU 设计是一个系统性、较长期的过程,需要一步一步地优化迭代,才能最终打造出具备世界竞争力的产品。

LiveVideoStack:在沐曦工作是一种什么样的体验?您有哪些收获?

虞新阳:沐曦和很多其他芯片设计公司一样,成立在国产芯片急需自立自强的大背景之下,需要在接下来的 5 到 10 年时间内快速成长起来。在宏观层面,一方面或多或少会有一些承担突破崛起的自豪感和责任感;另一方面竞争也很激烈,能感觉到时不我待的紧迫感。在微观层面,GPU 芯片和计算平台的研发虽然是一个很大的系统工程,但从大的模块(团队)功能角度来看又边界清晰,需要很强的相互配合,个人也需要较从容且深入地往特定方向去深耕,有较强的方向确定性;同事之间关系比较融洽,也有利于个人的学习成长。

另外,沐曦发展较快,也给了我可以从 0 到 1 的搭建算法团队的机会。其中在语音、NLP 等方向是我先前有了解但没有深入接触过的方向,现在有机会一起学习成长。更重要的是,沐曦是一家 GPU 设计公司,视频智能编码是重要的场景,让我有机会把先前的编解码器知识、GPU 架构设计背景,以及 AI 算法经验结合起来,努力做出一些融合性的创新和优化。

国产 GPU 的未来

LiveVideoStack:虞老师,您今年写了一篇名为《从计算芯片演进看 GPU 未来》的万字长文,非常详细地介绍了芯片的发展历史,您为什么会写这样一篇文章?

虞新阳:一方面,沐曦会积极参与国内相关的行业标准化组织、为相关标准制定及行业白皮书的修订贡献力量,作为公司代表我需要搜集提供 AI 芯片相关的一些基本情况;另一方面,身边的同事和朋友对 GPU 发展也很关切,常见的问题包括:当前中国的芯片发展状态是不是过热了?是不是短期就一阵风?有没有可能诞生世界级的芯片设计公司?

在收集了一些基本情况后,我就想干脆就更加系统深入地整理下整个计算芯片的发展过程,展现下当前的国际知名 GPU 企业是怎样一路发展过来的,希望能给接下来的国内 GPU 发展带来一些我个人的思考。

LiveVideoStack:根据您目前的观察,与国外 GPU 芯片公司相比,国内的公司还有哪些不足之处?国产 GPU 芯片研发还有哪些亟待解决的问题?

虞新阳:国内的 GPU 公司正在蓬勃发展中,迭代很快,已陆续发布或即将发布一些重量级的 GPU 产品。相比于国外的 GPU 芯片,在单纯的硬件规格层面已经慢慢追赶上来。但 GPU 是一个系统性平台下的产品,有了基础的硬件能力,还需要有好用的软件栈,譬如编程模型、推理引擎、虚拟化等等;然后还需要更上层庞杂的生态,譬如各种 SDK、参考解决方案等。在系统软件和生态层面,国内的 GPU 公司正在努力中。

此外,当前国产 GPU 基本还处在追赶者的状态。在中长期来看,不停的迭代创新才是真正能够从市场中胜出的关键,需要布局及建立更底层的能力来加强对 GPU 深入且持续的创新。这需要 GPU 公司自身的努力,也需要社会各方资源形成合力,支持 GPU 芯片公司开展创新应用落地。

LiveVideoStack:未来您比较看好哪些 GPU 的应用场景?

虞新阳:汽车自动驾驶已经在爆发的前夜,GPU 大量部署在训练侧,并且已经慢慢在推理侧(汽车)部署。生物医疗、机器人和元宇宙也在持续迭代中,接下来应该是 GPU 的大应用市场。此外,已经发展了一阵子的智慧城市,包括园区、社区的安防,也将会往更深入的层面去迭代。往更大处说,AI 就是一种基础能力,接下来在各行各业都会持续地深入迭代,譬如工业 4.0、智慧农业等等,而 GPU 作为 AI 的主要算力载体,都将得到更广泛的使用。

LiveVideoStack:最后,您可以向我们提前剧透一下您在本次大会上分享的内容吗?

虞新阳:在过去一段时间,结合 MXN 产品线的特点,我们在视频智能方向做了一些学习探索和实践,包括智能转码、视频超分、ASR 等。在这次大会上,我将就智能视频处理这个点做一些分享和讨论,期待大家一起来参与。

* 封面图来自 Unsplash

图片


还可输入800
全部评论
作者介绍

LiveVideoStack

音视频技术社区

文章

粉丝

视频

阅读排行
  • 2周
  • 4周
  • 16周