AIGC可能是当前科技圈最不容许忽视的趋势。根据咨询公司预测*,2023年中国AIGC产业规模约为143亿元,随着底层算力与大模型的完善,有望在2030年突破至惊人的万亿级。
2022年可以说是AIGC技术的元年,LLM领域的GPT和图像领域的Stable Diffusion,都属于行业的颠覆性技术。在图像领域,业界出现了如DALLE,Midjourney等基于简单描述文本生成图像的模型和工具。美图在2022年以来,发布了多项AIGC相关应用,LiveVideoStackCon 2023深圳站 邀请到了美图 影像研究院李骈臻老师分享相关经验。
在AI技术发展如火如荼的当下,大模型的运用与实践在各行各业以千姿百态的形式展开。音视频技术在多场景、多行业的应用中,对于智能化和效果性能的体验优化有较为极致的要求。如何运用好人工智能提升算法能力,解决多场景业务中的具体问题,需要创新地探索大模型技术及其应用方式。LiveVideoStackCon2023深圳站邀请到阿里云智能高级算法专家刘国栋,为我们介绍阿里云视频云的大模型算法实践。
近年来,大模型的概念逐渐受到更广泛的关注,而谈及大模型就离不开对底层数据的探索。大模型训练数据痛点与中文数据集现状;高质量数据定义;对话式数据模型实验;晴数智慧高质量数据解决方案。
上海站大会邀请到阿里云视频云的邹娟,为我们分享演讲《从规模化到全智能:智能媒体服务的重组与进化》。本次分享分为以上四部分,一是媒体服务(Mediaservices)面临的技术难题;二是如何使用统一“顶设”进行媒体服务的架构重组与规划设计;三是阿里云视频云服务不同企业客户不同场景需求面临的技术挑战、解法以及关于智能化演进的思路和实践;四是关于智能媒体服务的未来展望。
AIGC大模型的发展正逐渐为音视频、游戏等产业赋能,而多模态大模型作为它的下一个重要发展方向,正被业界高度关注。LiveVideoStackCon 2023 上海站邀请了来自上海交通大学的宋利教授,为大家从多模态媒体生成、多模态媒体编码和多模态媒体交互三个方面展望新一代多模态媒体的特点以及未来基于大模型的智能跨模态编码的新趋势 。
相较于前两年,2023年音视频行业的使用量增长缓慢,整个音视频行业遇到瓶颈。音视频的行业从业者面临着相互竞争、不得不“卷”的状态。我们需要进行怎样的创新,才能从这种“卷”的状态中脱离出来?LiveVideoStack 2023上海站邀请到了PPIO边缘云的创始人王闻宇,和我们分享了他针对这一问题进行的思考。本次分享包括近年音视频行业的分析、国外4款AIGC应用工具介绍、最新论文情况介绍,以及王闻宇对行业的看法和展望,以期为音视频从业者提供更具广度的行业视角。
入局元宇宙需要具备哪些能力?以及用AI技术驱动的虚拟人从建模到渲染,再到场景应用,当前遇到的瓶颈是什么?腾讯音乐天琴实验室在AI驱动虚拟人方面又做了哪些工作?在本篇采访中,董治老师分享了很多观点和相关经验。
LiveVideoStack
本次我们非常荣幸地采访到了天翼云AI产品研发总监陈金老师,和我们聊一聊产品创新所面临的最大难题,并介绍了天翼云研发的基于AI和NLP的数字虚拟老师目前的应用情况。
LiveVideoStack
随着智能汽车的不断发展,消费者对车身娱乐系统的要求也不断加强。虽然车身摄像头数量越来越多,但是依然面临画质不佳、存在畸变等问题,那么如何解决这些问题呢?
LiveVideoStack
近日,LiveVideoStack邀请到了即构科技视频处理工程师李凯,请他来跟我们聊聊即构自研移动端实时超分辨率技术的优势与应用场景,在移动端实现此技术所遇到的挑战与困难,即构所采取的应对策略等。
LiveVideoStack
文章内容整理自2022.02.24期公开课
LiveVideoStack
视频技术
转码
AI
AI转码
/var/www/lvs/wp-content/themes/livevideostack_wp/taxonomy.php on line 205
?type=news">
Warning: Attempt to read property "name" on bool in /var/www/lvs/wp-content/themes/livevideostack_wp/taxonomy.php on line 205
/var/www/lvs/wp-content/themes/livevideostack_wp/taxonomy.php on line 215
?type=yellow_page">
Warning: Attempt to read property "name" on bool in /var/www/lvs/wp-content/themes/livevideostack_wp/taxonomy.php on line 215
,
华为云,
査勇,
来自美摄科技的算法工程师侯康,他向我们介绍了过去的一年美摄科技在音视频领域关注的重点、在美摄汽车智能剪辑方案开发过程中所做的工作、研发过程中遇到的“坑”以及最近推出的桌面端深度视频编辑解决方案“美映PC版”等。
LiveVideoStack
北京冬奥黑科技; 揭秘虎年春晚硬核科技;全球首款AR隐形眼镜问世;索尼3D显示技术路径曝光
LiveVideoStack
在对大规模高质量二次元画风数据进行质量降低得到模拟的、需修复的原盘数据后,AI得以通过学习从低质图复原原图的逆过程来进行图像修复。当输出图像分辨率大于输入图像分辨率时,该技术被称作AI超分辨率技术,经过该技术处理后的图像可以在指定分辨率实现高清化。
LiveVideoStack
本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨,如何衡量和预估体验优化对业务增长的贡献,以及具体的体验优化实践分享。
LiveVideoStack
在本次LiveVideoStackCon 2021音视频技术大会 北京站,快手短视频架构负责人黄琦结合多年来对行业的观察与在快手的自身实践,和大家一起探讨视频大时代下基础架构的演进。
LiveVideoStack
华为云媒体服务RTC资深产品专家卢志航老师将从以Serverless为承载平台,以开放、专业的媒体处理能力为价值核心的方向,与大家探讨视频云与边缘云平台的下一代竞争力。
LiveVideoStack
在深度学习领域中,半监督、自监督算法通过借助无标签数据与无监督训练任务,可有效改善传统有监督算法中“泛化性能不足”、“模型过拟合”、“严重依赖数据标注质量”等问题。在此次LiveVideoStackCon 2021 音视频技术大会 北京站,我们邀请到了网易易盾资深算法工程师——崔若璇,为我们介绍了半监督学习领域的发展脉络,并展示半监督、自监督算法在网易易盾内容安全业务上的创新应用。
LiveVideoStack
最近Leonardo Chiariglione接受了LiveVideoStack的邮件采访,在采访中,我们和他一起讨论了新书 、MPEG 和 MPAI。下面是整理的采访稿。
LiveVideoStack
“连续两周交作业,目标仍然是做到99期。我的邮箱是ant.bao@livevideostack.com,欢迎大家提供新闻线索。”
LiveVideoStack
今年的东京奥运会,它将展示大部分科技。OBS承诺为全球观众呈现一场拥有丰富数据的视觉盛宴,其中IP、云、5G和人工智能都打破了广播制作的传统框架,改变了内容交付和观众体验的基础,让观众即使不亲临现场观看比赛也能获得最逼真的体验。
LiveVideoStack
时隔两年Google I/O大会再次与大家见面。虽然去年的大会因新冠疫情被迫取消,但技术的迭代发展却未被打断,反而因疫情的影响促使了技术的创新变得愈加以人们的需求为首要考量,从而变得更具人性化也更具智能化。
LiveVideoStack
随着5G和AI的发展,内容表达视频化成为了当今的主流,很多行业对视频分发有非常旺盛的需求。我们非常荣幸地请到了华为云的资深视频架构师黄挺,为大家介绍基于互联网的实时音视频服务所面临的挑战,分享华为云原生媒体网络全方位保障实时音视频服务体验的实践。
LiveVideoStack
本次LiveVideoStack线上分享邀请到了英伟达DevTech团队技术负责人季光一起探讨把模型运行到TensorRT的简易方法,帮助GPU编程的初学者加速自己的AI模型。
LiveVideoStack
本文来自于快手视频算法工程师团队负责人闻兴在LiveVideoStackCon2020北京站上的精彩分享。凭借本主题演讲,闻兴老师荣获此次大会评选的优秀讲师称号。
LiveVideoStack
本次LiveVideoStackCon 2020线下北京峰会我们邀请到了360AI影像事业部总经理张焰老师来做分享,他会为我们带来目前AI视觉在教育中的创新应用,包括课堂专注度、课堂接受度、疲劳提醒、姿态纠正等在线教育场景解决方案。
LiveVideoStack
2020年欧洲计算机视觉会议(ECCV)于8月23日至28日在网上举行,由1360篇论文组成,包括104场orals,160场spotlights以及1096篇posters,共进行有45场workshops和16场tutorials。与近年来的ML和CV会议一样,产出了大量精彩的论文。
LiveVideoStack
在LiveVideoStackCon 2020 SFO线上大会上,我们邀请到NETINT公司的周炎均老师(Daniel Zhou)同我们分享通过在同一芯片上结合视频编码器和DNN引擎,从适应性、可扩展性和延迟三大方面,探讨实时高密度AI辅助视频编码的ASIC解决方案。
LiveVideoStack
阿里巴巴淘系技术部于9月日正式开源业界首个大规模的多模态直播服饰检索数据集(Watch and Buy),以推动视频多模态检索技术的研究技术的研究。
LiveVideoStack
苹果应用商店拒绝Stadia和xCloud、Instagram推出Reels挑战TikTok等
LiveVideoStack
Decode the Week 视频技术 AI 网络传输 LiveVideoStackCon2020首届音视频线上峰会,
5G时代是超高清的时代,然而,冰冻三尺非一日之寒,在超高清视频直播点播等业务研发过程中,总会遇到很多令人抓狂的难题。本次LiveVideoStackCon 2020线上峰会我们邀请到了金山云高级技术总监蔡媛,她将从金山云魔镜平台本身出发,讲解平台如何帮助使用者提升画质评测效率,保障评测质量,一站式解决用户画质评测的难点。
LiveVideoStack
Decode the Week≠音视频技术周刊
LiveVideoStack
当前互联网上大于75%的流量都来自于视频,据估计5G时代视频流量更是高达90%以上。如何压缩、传输以及分析视频内容成为5G部署及大规模应用的关键。虽然传统的5G部署也有一定市场,但经过AI加持的智能终端/边缘/云计算可以为5G带来更大的收益及降低其部署成本。本次报告主要探索了在硬件层面如何利用传统方法及深度学习方法对视频进行压缩和分析,以及如何在5G信道中传输压缩后的码流。
LiveVideoStack
在新年伊始我们开展了视频会议的专题策划,与Cisco WebEx、声网Agora、亿联网络等探讨了视频会议2020年的机遇与挑战,并描画了平台未来的图景。
LiveVideoStack
本次LiveVideoStackCon 2021北京站我们邀请到了阿里云智能视频云算法专家——王钊,为大家分享阿里云在AI视频编码技术的新探索。
LiveVideoStack
本文由NVIDIA深度学习解决方案架构师 吴金钟 在线上分享中的演讲内容整理而成,详细分析探讨了英伟达GPU上的硬编解码方案和CUDA并行计算架构赋能下的音视频AI技术研究与最新实践应用。
LiveVideoStack
再次感谢艾哈迈德·阿尼斯(Ahmed Anis)为收集这些数据做出的贡献,并感谢KDnuggets的其他工作人员的意见,见解和建议。
LiveVideoStack
二月中旬,小米10系列手机正式发布,作为小米10周年的诚意之作,“科技突破极限”正式进军高端市场。小米10系列不仅搭载了目前为止性能最为强劲的高通骁龙865处理器,更拥有LPDDR5内存,1亿像素主摄,横向振动马达等顶级配置。
LiveVideoStack
紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答