音视频技术开发周刊 | 317

ST-VIO是一种将轮式地面车辆的单轨动力学模型与视觉惯性里程计紧密结合的新方法。我们的方法在线校准和调整动力学模型，并有助于在未来控制输入的条件下进行准确的正向预测。单轨动力学模型使用常微分方程近似于在平坦地面上特定控制输入下的轮式车辆运动。我们使用单轨模型的无奇异性和可微分变体，以实现作为动力学因子的无缝集成到VIO和以在线优化模型参数以及VIO状态变量。

TRO 2023|iSimLoc：利用虚拟图像对未看到的环境进行视觉全局定位

相机由于体积小、重量轻、功耗低且成本低,是无人机超视距操作的一种有吸引力的设备。但是,目前最先进的视觉定位算法在匹配视觉数据方面存在困难,尤其是在照明或视角产生显著变化时。本文提出了iSimLoc,这是一种基于学习的全局重定位方法,对外观和视角的变化具有鲁棒性。iSimLoc的场景识别网络学习到的特征可以用来匹配查询图像和不同视觉风格域和视角的参考图像。此外,我们的分层全局重定位模块以粗细粒度的方式进行搜索,使iSimLoc可以进行快速精确的姿态估计。

行研报告 | 我国半导体硅片产业市场发展研究分析报告。

近年来，受益于5G、人工智能、消费电子、汽车电子等需求拉动，全球半导体材料市场规模呈现波动并整体向上的态势。根据SEMI公布的数据显示，2021年全球半导体材料市场规模为643亿美元，与2020年的555亿美元相比，同比增长15.9%。预计2023年全球半导体材料市场整体规模将达到700亿美元，市场规模创历史新高。

高通发布多款芯片，自研CPU亮相

在会议前期，高通方面首先表示，公司的芯片已经为超过30亿台设备提供至此。以此同时，高通方面还指出，骁龙品牌的认可程度远超竞争对手。能获得如此高的评价，这首先得益于公司在产品上持之以恒的投入和创新。

瞄准碳化硅，奇瑞携手长飞先进成立汽车芯片实验室

近日，安徽长飞先进半导体有限公司（下文简称“长飞先进”）与奇瑞汽车股份有限公司（下文简称“奇瑞汽车”）成功举办了“汽车芯片联合实验室”战略合作签约仪式。

Voice Audio Daily Paper (AdaSpeech系列)

定制语音是商业语音平台中的一种特定的文本到语音（TTS）服务，旨在适应源TTS模型，使用目标说话人的少量语音为其合成个性化语音。

声音的产生——结构致声：第二部分

弦将继续振荡，直至能量耗尽，无论是通过声音将能量辐射出去还是被阻尼耗尽。阻尼将能量转换成一种使系统（此处为弦）不再振荡的形式——通常是消散热量（导走），从系统中散失。在不希望有振动的系统中，通过诸如摩擦和粘性相互作用之类的机制，将能量从振荡运动中快速耗散。汽车减震器就是一个典型的例子。

瑞声科技磁性材料研发制造项目落户马鞍山：永磁性能最强，将推全新产品线

瑞声科技发布公告，10 月 24 日，瑞声科技与马鞍山郑蒲港新区现代产业园区管委会在深圳签署磁性材料研发制造项目合作协议。

NeRF&Beyond 10.25日报(NVS质量评价,GNeSF,LiCROM,多模态3D场景理解,Wonder3D）

神经视图合成 (NVS) 是合成自由视点视频最成功的技术之一，能够仅从一组稀疏的捕获图像中实现高保真度。这一成功催生了该技术的许多变体，每种技术通常使用 PSNR、SSIM 或 LPIPS 等图像质量指标在一组测试视图上进行评估。目前还缺乏关于 NVS 方法如何在感知视频质量方面表现的研究。

对话网宿科技庄晓川：QUIC，新一代协议普及路上的现实与理想

HTTP/3旨在提高网站的速度和性能。作为新一代网络传输协议，HTTP/3的采用率保持着迅猛的增长态势。根据W3Techs的最新数据，HTTP/3的使用率已经超过27.0%。在谷歌等巨头的推动下，HTTP/3在国外的普及之路可谓“高歌猛进”，然而，其在国内的发展则相对缓慢。

AIGC底层数据探索——高质量数据助力大模型迭代升级

近年来，大模型的概念逐渐受到更广泛的关注，而谈及大模型就离不开对底层数据的探索。大模型训练数据痛点与中文数据集现状；高质量数据定义；对话式数据模型实验；晴数智慧高质量数据解决方案。

「专题速递」Web端直播流播放器、WebCodecs与音视频数据、浏览器低延时端侧优化

浏览器作为直接面向用户大众的接口，在不断变革的数字时代中扮演着关键角色。本专题将聚焦于浏览器技术，探讨新技术的发展如何为音视频业务及产品开发带来新的可能性。我们将深入研究新技术在浏览器领域的应用，探索其如何改善用户体验，提高性能，以及拓宽音视频产品的创新边界。

老黄最新专访：时间倒流30岁，我绝对不会创办英伟达！

黄老板在最近的一个访谈中表示，回到30岁，我不会选择创办英伟达。他还聊了很多他在这30年里创立英伟达遇到的各种问题，也分享了自己的愿景。他想让所有人明白，英伟达为什么能一路走到现在，而英伟达的未来又在哪里。

讯飞星火升级 3.0：整体超越 ChatGPT，2024 年将实现对标 GPT-4

距离上一个大版本仅两个月过去，科大讯飞在 1024 对外正式推出讯飞星火认知大模型 3.0 版本。今年 5 月，讯飞星火认知大模型刚刚面世时，科大讯飞董事长刘庆峰曾立下 Flag：10 月 24 日，星火认知大模型的能力要全面对标 ChatGPT。
晚点独家｜华为将全面接管问界销售体系；腾讯企业服务不再设收入增长目标，转为加速扭亏

《晚点 Auto》获悉，问界所有销售人员将加入华为全资子公司 “深圳慧通商务有限公司”，成为华为的编外员工，换签将在明年全部完成。这之前，这些员工就职于华为和赛力斯的经销商。

日程揭晓！速览深圳站大会专题议程详解

LiveVideoStackCon 2023 音视频技术大会深圳站，保持着往届强大的讲师阵容以及高水准的演讲质量。两天的参会时间，您可以快速了解音视频大咖前瞻的思想、把握音视频技术发展的最新动向、深入学习技术内容和工程化方面的一手实践。现在，深圳站大会日程正式揭晓，一起来看看您所关注的演讲都出现在哪些时段吧！
●时间：2023年11月24日-25日
●地点：深圳圣淘沙酒店（翡翠店）
●咨询：13520771810（微信同号）了解详情。
●官方链接：https://sz2023.livevideostack.com/topics

全部评论

作者介绍

LiveVideoStack

阅读排行

2周
4周
16周

热门视频

LiveVideoStackCon 2023 深圳站