音视频技术开发周刊 | 317

2023年11月13日

音视频技术开发周刊 | 317

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。


MIT惊人再证大语言模型是世界模型!LLM能分清真理和谎言,还能被人类洗脑

MIT等学者的「世界模型」第二弹来了!这次,他们证明了LLM能够分清真话和假话,而通过「脑神经手术」,人类甚至还能给LLM打上思想钢印,改变它的信念。

百度大模型加持,元宇宙竟然还能「卷」出新玩法!AI一键作画、智能NPC秒回

元宇宙,竟然还能卷出新玩法?这次,乘着大模型的快车,百度又在元宇宙里开启了不一样的极致体验。

DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案

DeepMind的研究人员发现,LLM有一个天生的缺陷——在推理过程中无法通过自我纠正获得更好的回复,除非数据集中预设了真值标签。马库斯又高兴地转发了这篇论文。

AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述

AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界都受到了广泛关注和探讨。