音视频技术开发周刊 | 147

LiveVideoStack 2020年6月8日

每周一期,纵览音视频技术领域的干货和新闻投稿:contribute@livevideostack.com。



架构


十大必知开源WebRTC服务器

WebRTC是一个非常新的技术,很多用户仍然在初步摸索阶段。有一些用户是不清楚WebRTC的用户场景,不知道WebRTC究竟可以使用在哪些应用场景中。

https://mp.weixin.qq.com/s/W76r12SIHCGuAU9-IawhzQ


大型群组音视频通话中的 WebRTC CPU 要求

在WebRTC中启用大型群组视频通话是可能的,但需要付出很多努力。WebRTC CPU消耗需要优化,这意味着需要使用许多不同的技术。

https://bloggeek.me/webrtc-cpu-group-calls/

开源流媒体服务器:为何一定得再撸个新的

作为开发者,我们需要有一个服务器来支持新视频行业的互联网化,有哪个开源方案能支持新爆发的业务?该方案需要支持哪些关键的能力或需求?本文由自阿里云RTC服务器团队负责人杨成立在LiveVideoStack线上分享的内容整理而成。

https://mp.weixin.qq.com/s/EyfqY932YFsXyD7e1jHoBg

传输网络


Ramp 推出对等 P2P eCDN,成为所有人的 eCDN

与 StriveCast 合作,提供了 WebRTC P2P 视频交付能力。

https://www.globenewswire.com/news-release/2020/05/19/2035699/0/en/Ramp-Introduces-Peer-to-Peer-eCDN-Becomes-the-eCDN-for-All.html

IPFS是一个天生的CDN,将会在全世界进行内容加速

由于CDN技术同质化严重,激烈的价格战让CDN服务商不得不寻求技术突围。作为新兴技术,IPFS将会在CDN行业大放异彩。

https://mp.weixin.qq.com/s/A5nCmEa_0CbYvcE87RmnZw

实现实时视频流跨云架构的14种方法

任何计划在Red5 Pro平台上使用公共云服务来支持大规模流媒体直播的人都有理由期待最佳解决方案是最便宜的方案。

https://www.red5pro.com/blog/14-ways-to-implement-cross-cloud-architecture-for-live-video-streaming/

编解码


FFmpeg的过滤器图和时间轴

本文是来自0612 TV的演讲,演讲内容是FFmpeg的先进的技术第二部分——过滤器图和时间轴。

https://mp.weixin.qq.com/s/hK1j06CV9sR-d0FUlm7NgA

延长H.264的寿命

本文来自the video insiders的一个采访,主题是"Extending the life of H.264"。邀请到的采访者分别是Discovery视频传输平台的副主席Avisor Ten-Ami,iStreamPlanet的技术总监Josh Barnard和FastVDO的CEO Pankaj Topiwala。

https://mp.weixin.qq.com/s/wqoLf2J_QV0a7ElqOyS1Vw

编解码标准的范式转换——MPEG-5 PART2 LCEVC的介绍

本文来自2020 NAB Show Conference,视频原标题为“A Paradigm Shift In Codec Standards: MPEG-5 Part 2 LCEVC”,演讲者是来自V-Nova的Fabio Murra,他主要介绍了MPEG-5第二部分的LCEVC编码方案。

https://mp.weixin.qq.com/s/o2DTVg4Di_O1gJ8thuN7EQ

视频技术


插帧让视频更丝滑

目前的智能手机、显示器以及电视等我们常用的显示设备的屏幕刷新率都是以60Hz作为基准,60Hz就意味着它们每秒能刷新60张画面,也就是每秒60FPS,如果通过技术手段将24FPS视频补帧到60FPS,将能让视频在60Hz显示器上更加顺滑,从而大大提升观影体验。

https://mp.weixin.qq.com/s/awRSwf5_0utlJSG78SCSuQ

“云会展”还能火多久?

会展业可能是2020年受疫情影响最严重的行业之一,疫后漫长的复苏期也为其前景蒙上一层阴影,如何找回会展业“丢失的一年”,成为从业者乃至国家层面的关注焦点。在疫情刺激和政策支持的双重推力下,云上展会呈现遍地开花的态势。

https://mp.weixin.qq.com/s/Fof9yX02xwX8P0WruDb9ww

Android OpenGL ES 实现 3D 阿凡达效果

3D 效果选择使用 OpenGL 实现是再合适不过了,当然 Vulkan 也挺香的。

https://mp.weixin.qq.com/s/HWCwDjYhU-juXpWICvFOMw

音视频开发入门必备之基础知识

互联网信息的传播与娱乐方式经历了从文字到图片再到音视频的转变,现如今抖音、快手等短视频更是如日中天,特别是5G时代的到来,笔者相信互联网对音视频开发者的需求会迎来更大的增长需求,何况音视频开发者因为其稀缺性薪酬本来就比较高。

https://mp.weixin.qq.com/s/gNraIa7-fwxC-SUakiIZ2Q

ACM TOG:层析投影系统-沉浸式3D观影体验

自从电影诞生以来,更加舒适真实,具有沉浸感的观影体验一直是电影院与观众们所追求的。来自首尔大学的研究团队在计算机图形学国际顶级期刊 ACM Transactions on Graphics 发表论文,该团队提出了一款面向放映厅中大量观影者并可以提供良好且稳定的沉浸式观看体验的3D投影系统——层析投影系统(Tomographic Projector)。

https://mp.weixin.qq.com/s/rRCN_lIgxgbq9PjfRr5X_w

人物专访


这条路有多长,有多难 | 专访OnVideo创始人余世兵&刘歧

一个创业初期的科技公司都是“无知无畏”的少年,少年的莽撞是可爱的,少年的真心是执拗的,进入充实又庸碌、锐利又残酷的商业斗兽场,少年又面临着各种不可预知的风险。

OnVideo选择快手,是希冀“好风凭借力,送我入青云”,趁此机会开疆辟土,一口气攻下国内B端视频编辑市场?还是想通过技术售卖实现更大的梦想,以便转换航道朝着新风口再出发?

世界瞬息万变,而我们唯一可以确定的,是面对远方未知的一切,一定还有什么等着OnVideo的创始团队去实现。

https://mp.weixin.qq.com/s/Y0c-3DQhIzOiR4kG-cp9bA


在线催稿:当一位高级视频算法工程师接受采访

讲师专访是每一届LiveVideoStackCon举办前的固有“热身”和传统节目,我们夹带着为大会做宣传的私心(却也并不为过),但更多的是希望帮助大家多熟悉、多了解这些在音视频技术领域摸爬滚打多年的工程师、开发者,像朋友一样真心接触、平等交流。毕竟,技术的分享本就不应该居高临下,他们也曾是你,或许有一天,你也将成为他们(大神们请忽略这句)。

https://mp.weixin.qq.com/s/KU8K3NqsuT2ngqY6oaUeIQ

云游戏是大厂的“游戏”之腾讯云<云游戏指南>

未来游戏将由传统的通用计算型服务器转向定制化专用的云游戏IaaS+PaaS服务,而云计算将成为未来游戏的基础设施。

https://mp.weixin.qq.com/s/aUfTf7r2-etL-6uY21qIOg

AI智能


搜狗 AI 交互技术部总经理陈伟:未来AI语音交互产品将会走向多模态

受限于人工同传或速记人员费用高、记忆力及翻译 / 速记速度有限等因素,搜狗 AI 录音笔逐渐出现在越来越多会议场景中,AI 录音笔可以将演讲者的语音实时转成文本,并且进行同步翻译,很大程度上取代了人工同传和速记人员,帮助人们实现了不同语言间的低成本交流。那么,这背后又有哪些智能语音技术作为支撑?在 AICon 大会召开前夕,InfoQ 有幸采访了搜狗 AI 交互技术部总经理陈伟,听他分享搜狗 AI 交互技术的发展历程及应用实践。

https://mp.weixin.qq.com/s/EPop-KRXAFtCkwszqMohFA

基于深度学习和传统算法的人体姿态估计,技术细节都讲清楚了

计算机视觉的一大研究热点是人体姿态估计,还有很多问题急需解决,比如遮挡,交互等等。在最近的CVPR2020里边也有很多这方面的工作。本文站长主要是想谈谈基于深度学习的实时多人姿态估计。

https://mp.weixin.qq.com/s/rJnn6WGJ8je9873-LIZ9iw

资源推荐


FFmpeg Android

android端基于FFmpeg实现音频剪切、拼接、转码、混音、编解码;视频剪切、水印、截图、转码、编解码、转Gif动图、画面拼接、视频倒播;音视频合成与分离;音视频解码、同步与播放;FFmpeg本地推流、H264与RTMP实时推流直播;OpenGL实时滤镜;FFmpeg滤镜:素描、色彩平衡、hue、lut、模糊、九宫格等;基于IjkPlayer修改支持RTSP超低延时直播(局域网1080P延时130ms)、暂停、静音,多路投屏直播

https://github.com/xufuji456/FFmpegAndroid

万字详解:腾讯如何自研大规模知识图谱 Topbase

Topbase 是由 TEG-AI 平台部构建并维护的一个专注于通用领域知识图谱,其涉及 226 种概念类型,共计 1 亿多实体,三元组数量达 22 亿。在技术上,Topbase 支持图谱的自动构建和数据的及时更新入库。

https://mp.weixin.qq.com/s/Qp6w7uFcgqKXzM7dWhYwFg

 

还可输入800
全部评论
作者介绍

LiveVideoStack

阅读排行
  • 2周
  • 4周
  • 16周