阿里云视频云:“云端一体”的智能媒体生产之路

2020-11-03 10:40:11 推荐

“多媒体开启新视界,把5G、VR、物联网、人工智能、新的网络与视频标准有望带来一个逼近真实、更便利的世界,再加上量子通信、半导体新技术、基因技术、分子科技、未来科技的力量将带给人类不可想象的世界”。

这是Live Video Stack在2020年10月31日举办的音视频技术大会所传递的能量,这场大会聚集了音视频领域顶级技术人,阿里云视频云的技术专家作为重要嘉宾参会,围绕智能媒体生产能力,传递自身的技术发展观点和探索演进信念。

image.png

阿里云智能视频云高级技术专家邹娟,在大会发表重要演讲

阿里云视频云:云端一体,所见即所得

诚然,在5G和AI的驱动下,智能媒体生产已成为重要风向,依托阿里云2020年所提出的“云端一体”战略,云端一体化的智能媒体生产能力将更加凸显。

如今的互联网流量70%均来自视频,面对5G带来的高带宽和低延时,人们对视频内容的质量要求不断提升,因此在这个基础上,视频云媒体生产的内容和制作方式本身将更专业,画面也更清晰,超低延时也会给媒体生产的体验和交互带来非常大的变化, “所见即所得”的生产方式将成为标配。

整个媒体生产的演进在经历从人工到智能、从小众到大众、从被动接收到个性互动的过程,针对智能媒体生产能力,阿里云视频云一直深度关注几个要点,第一,超高清制作能力;第二,AI如何更好的融入到生产制作过程,甚至在创意阶段就融合进入技术元素;第三,在保持专业性和效果的同时,聚焦能够降低门槛的工具和技术;第四,一些更专业场景的模式和方法,如电影剪辑之道,转播车、专业演播室、后期制作的流程和方法等。

攻克之艰:多维度的协同与平衡

实现技术落地最大的难点是打地基和架构设计的部分,因为这关系到整个平台后续的生命力。这里面要考虑多个维度的协同和关系,包含云和端的协同,专业与普惠的关系,现场实时制作与剪辑合成的融合等等。以云和端为例,阿里云视频云设计的理念是云端既可以一体无缝配合,也可以拆开来独立提供服务,也就是“云+端”可分可合的“PaaS+”架构,同时在渲染效果上尽量保持一致。

另外,还要掌握专业与低门槛的平衡,在时间线的设计上要保留生产制作的专业性,但是时间线的包装和使用上,又需要考虑普惠价值,让更多客户能低门槛的使用平台或服务。同时,对于现场实时制作与后期剪辑制作而言,不仅是输入输出互为搭配,同时AI能力在各个环节的加持与复用,也需要好好设计。

image.png

场景AI:“脱离场景谈AI就是耍流氓”

提及阿里云视频云智能生产能力的技术落地,2018年世界杯球星集锦项目是一个经典案例。

该项目的技术难点有三:首先是时间高度紧张,从决定要做球星集锦到上线,仅一周时间,且因为世界杯的时效性极强,如果时机错过就失去了媒体传播价值。于是在一周之期,视频云团队要选择AI算法、选择时间线主区间的算法、时间线多区间边界扩散和收敛的算法,以及这些算法如何在工程层配合,对最终合成效果的反复调优。

第二个难点,是在极短时间内,除语音识别在此前为世界杯场景做过一些储备之外,其他算法可能来不及场景适配,这时就需要对算法的边界,也就是每个算法能达到的效果上限非常了解,要能够把像人脸识别、语音识别、视频分镜、fifa实时场记等综合用好,为最终时间线的生成服务。

最后一点,也是非常重要的一点,就是研发者必须对场景有非常深入的理解。项目负责人(阿里云智能视频云高级技术专家邹娟),在记者采访时说到,“有句开玩笑的话,‘脱离场景谈AI就是耍流氓‘,如果不了解足球,不了解世界杯,可能没有办法去理解一个球星在整个比赛中哪些片段是有精彩的,或者有看点的。所以我非常庆幸自己是一个十几年的资深足球迷,对足球、世界杯、球星、球队都很了解,这也是项目能快速上线的一个重要原因。”

后疫情时代:一个可能改变时代的机会

2020带来的后疫情时代,音视频技术和服务存在两个方面的理解,第一,音视频技术迅速为企业所熟悉和需要,而音视频云服务将成为云计算的基础设施,故,音视频技术和服务已经不再是某些行业的特殊需求,而是全行业的基础需求。第二,在疫情期间,社会及各种企业对在线服务,尤其是云服务的接受程度有了显著提高,那么在后疫情时代,很多客户希望能快速沉淀在线业务,尤其是与音视频相关的如视频会议、在线教育、直播等业务形式,这就催生了对各种视频解决方案和工具的需求,可以快速降低客户使用视频技术和服务的门槛,让客户把宝贵的时间花在自己的业务场景上。从另一个方向看,相当于整个时代对内容和交互方式有了新的要求,而这也正是视频云技术人的机会,一个可能改变时代的机会。

image.png

阿里云智能视频云资深技术专家何亚明,在大会参加圆桌论坛

技术信念:仰望星空,脚踏实地

在视频时代爆发的今天,中国视频云市场整体呈现高速增长,据IDC预测,到2024年中国视频云市场规模会超过220亿美元,而AI技术的融合优势脱颖而出。阿里云视频云,以革新者的姿态不断创造和引领,以推动新内容、新交互的变革。秉承阿里云的企业精神,团队的每个人既保持对技术的好奇,多一些理想主义和对未来的思考,同时也能脚踏实地的把眼前能够使用的技术进行落地,产生业务价值。这便是仰望星空,脚踏实地。

“在阿里云,大家都是跑接力棒的,在前面的人还能跑的时候,就会拼命地往前跑,在发现自己跑不动之前,要找到更强的人接这一棒。”邹娟分享的这句话,足以触动技术人不遗余力地坚持这份不褪色的理想主义。

未来已来,这将是智能媒体生产的探索之路,也是阿里云视频云实现技术改变世界的理想之路。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。

相关文章

{{news.title}}

{{news.timeFormat}} {{news.author}}

正在加载......