音视频技术开发周刊 | 293

Max 2023年7月6日

谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放

以上是2023 Google I/O 大会的重点内容,AI含量极高。

谷歌推拥有26000个H100的超算,加速AI军备竞赛

云提供商正在组建 GPU 大军,以提供更多的 AI 火力。在今天举行的年度 Google I/O 开发者大会上,Google 宣布了一款拥有 26,000 个 GPU 的 AI 超级计算机——A3 ,这个超级计算机是谷歌与微软争夺 AI 霸权的斗争中投入更多资源进行积极反攻的又一证据。

OpenAI发布最新开源项目Shap-E,通过文本就能生成3D模型

5月6日,ChatGPT母公司OpenAI发布了最新开源项目Shap-E,通过文本就能生成3D模型。目前github已经突破2000颗星。

https://github.com/openai/shap-e 

为什么剑桥出身的“AI教父”辛顿会担心?

人类社会的稳定性和鲁棒性并不是弱不禁风、一触即倒的,熟话说的好,“魔高一尺,道高一丈”,未雨绸缪、居安思危将会一直伴随着人类文明的进化发展,现在发生的,过去已经发生过,而且还不止一次,估计这次也不会例外...... 

HugNLP开源啦!教你玩转各种NLP任务,还可训类ChatGPT模型

在大模型训练异常火爆的今天,基于HugNLP框架,还推出了能够支持类ChatGPT模型进行训练和部署的产品HugChat。

用图像对齐所有模态,Meta开源多感官AI基础模型,实现大一统

Orillusion引擎正式开源!AIGC时代下的WebGPU轻量级3D渲染引擎!

IBM亮王炸!推出大模型Watsonx,7月将开源!

Watsonx由三大块组成,基础模型watsonx.ai;基于开放式 Lakehouse 架构构建的专用数据存储平台watsonx.data;用于AI安全治理的watsonx.governance。在这三大平台赋能下,可为用户提供一站式安全可靠的生成式AI服务。

「AI孙燕姿」全网沸腾!AI翻唱大爆发,整个华语乐坛都「复兴」了

2023春季《计算共形几何》课程总结

抖音关于人工智能生成内容的平台规范暨行业倡议

人工智能技术的快速发展,为互联网行业带来了更多可能性的同时,也带来了虚假信息、侵权等问题。参照《互联网信息服务深度合成管理规定》等法律法规,抖音提出十一条平台规范与行业倡议。

声网自研编码器 a264 & a265:更优画质更低能耗,进一步适配实时互动场景需求

“玲珑”编解码融合架构助力视频多元化需求

LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。

MPEG LA和Via Licensing专利池的合并会带来哪些影响?

文章表示,该合并将使MPEG LA负责管理HEVC和VVC等主要视频编解码器的专利池,这些编解码器是当前和未来的许多流媒体应用程序所依赖的核心技术。此外,该合并还将减少客户在获取许可证时需要与多家公司沟通的复杂性,从而降低了使用这些编解码器的成本。

https://www.streamingmedia.com/Articles/News/Online-Video-News/Via-LAs-Heath-Hoglund-Talks-MPEG-LA-Via-Licensing-Patent-Pool-Merger-158547.aspx