音视频技术开发周刊 | 306

Max 2023年8月21日

音视频技术开发周刊 | 306

 LiveVideoStack LiveVideoStack 2023-08-13 12:01 

每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。


人工智能研究人员声称,通过Zoom音频检测击键的准确率为93%

通过记录按键并训练深度学习模型,三位研究人员声称,基于单个按键的声音特征,他们在解释远程按键方面的准确率达到了90%以上。

https://arstechnica.com/gadgets/2023/08/type-softly-researchers-can-guess-keystrokes-by-sound-with-93-accuracy/

GitHub 1.1万星,模拟软件开发流程,开源框架MetaGPT爆火

随着大型语言模型(LLM)的日渐成熟,利用其构建 AI 智能体成为一个新的研究方向。已有研究使用 LLM 驱动多智能体自主完成了一些任务。然而,现有研究主要集中在简单任务上,缺乏对复杂任务的探索。这主要是因为大型语言模型存在「幻觉」问题,特别是当多个智能体相互作用时,幻觉会进一步被放大,以至于无法用于复杂任务。最近,一个名为「MetaGPT」的开源框架尝试解决这个问题。

对话Sam Altman与Greg Brockman:初心和过去,信念和现在,责任和未来

近日,硅谷著名投资人Reid Hoffman和Aria Finger联手对Sam Altman和Greg Brockman进行了一场访谈,访谈涉及到主题有:OpenAI的使命,人工智能对教育、医疗等行业的变革性影响,人工智能如何面对监管,OpenAI成功的关键,未来的发展畅想。