本篇文章2017字,读完约5分钟

最近,从莫斯科国立大学( moscow state university )举办的世界视频编码器大赛中传来了好消息,金山云自主开发的kav1编码器在ugc课程中排名第一。

msu视频编码比赛是世界性的宴会,在视频编码行业产生了很大的影响,至今已连续举办了15次,每年都有很多国内外重量级公司和组织参加。

这次,金山云kav1在ugc课程中获胜,不仅说明了团队在金山云视频编码行业的实力和创新潜力,还向业界展示了av1未来的广泛应用前景。

在ugc课程中名列鼎

现在,用户生成内容( ugc )和专业生成内容( PGC )是网络视频的两个主要来源。 作为普遍的传递范式,ugc拍摄的低阈值可以满足普通人自我表现的需要。 因为每个人都可以用短篇视频这种最简单直观的形式与别人和社会共享自己的观点和生活。 事实上,在抖音、快手、b站等视频类社会交流平台中,无论是长视频还是短视频,顾客参与( ugc )都是更大的比重。

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

除了来源不同外,pgc视频和ugc视频的区别在于整体质量的差异。 pgc视频在拍摄时选择更好的光照方式和合理的运动场景的比例,制作初期也使用专业的编码手段确保抑制质量。 与此相对,ugc的拍摄制作、冲压、后期效果都由非专家完成,拍摄环境的检查不足,制作初期存在对焦失真、模糊、噪声大等问题,解决过程中也经历了多次视频转码,转码次数

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

尽管如此,考虑到全球视频云服务的主要流量是ugc,我们注意到ugc代码适合实际的商业场景,这也是msu竞赛ugc课程的初衷。 这次ugc课程的视频来自几个网络头自由度高的原始视频平台,通过沿袭msu一贯采用的时空多噪声的聚类方法而得到,涵盖了很多场景。

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

这次ugc课程的结果是,金山云kav1在人工评价中比reference(x265 )上升了41% (去年的主观课程冠军比x265上升了33% ),比svt-av1、vp9、x264分别上升了45%、71%、73%。

msu大会现有的主观、客观、4k等课程集中在AVL、vvc上,这些编码器都是为4k、8k等高清视频而生的,在低分辨率的场景中,比现在流行的x265等编码器更有特点 金山云kav1作为av1标准的自研编码器,以高清为目标,但在ugc场景中特征也很明显。 为了这次的msu比赛,金山云专业的视频编码器开发团队在编码器和ai两个方向上取长度来弥补长度,开发了符合人眼感知模型的kav1。

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

金山云kav1第一次参加编码器行业的宴会就能取得下流的成绩,表明近年来金山云ai和编解码器的研究开发持续取得成果。

kav1背后的功臣:感知评价指标kpa

由于焦点失真、模糊、噪声、场景区分较大等因素,ugc视频的主观优化成为比pgc视频更具挑战性的一环。 为了更好地优化ugc场景的编码效果,金山云自主开发了图像视频识别评价指标kingsoftcloudperceptualassessment ( KPA )。

在这次msu比赛中,利用kpa的强大能力,金山云kav1继承了经典的视频混合框架,在此基础上根据kpa重新设计rdo目标函数,利用jnd+kpa两者,增大人眼感知不到的区域所占的编码率 包括时域空域收集噪声、压缩引起的压缩噪声、暗场、高频集中等不敏感的区域。 然后采用warp motion技术提高局部仿射运动估计等全面提高了预测、变换、量化、熵编码等各过程的压缩效率。 增加dct-8/dst-7等变换,提高残差的变换效率,对各编码单位的qp进行微调,得到更好的码率分配。 改革创新的熵编码机制超过了经典的cabac计算数字。 通过这些手段,金山云kav1在确保压缩率的基础上大幅提高了图像的画质。

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

(左侧) x265编码后的图像(右侧)金山云kav1编码后的图像

目前能够达到商用水平的评价指标非常少,学术界的评价指标首先是对比边界条件制约非常确定的场景。 商用级的全部参考评价指标现在除了psnr和ssim外,还是netflix在年发布的vmaf,vmaf是最初比较netflix的pgc场景设计的,不能直接用于ugc视频。 kpa首先比较ugc视频,除了共同的整体质量评价之外,还包括子维质量、局部质量等细分评价指标。

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

在kpa的开发过程中,在各种场景下收集ugc和pgc视频,至少50多名专业评价者主观评价各视频,从而从根本上消除了数据的主观评价变动和精度问题。 另外,从拷贝、场景、质量等多个维度中均衡地筛选收集到的数据,在确保远远超过行业开源数据的数据规模的基础上,推进数据的多样化。 在模型层面,通过攻防设计、合作学习、困难样本发掘等方法,提高了模型的鲁棒性和精度,在ugc场景中,srocc和gmad得分优于业界有名的参考算法vmaf。

【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

在视频高清化的趋势下,客户对视频的要求越来越高,对视频编解码技术的要求也越来越高。 根据视频编解码器的特点,金山云坚持技术立业,不断探索核心技术,寻求持续突破。

标题:【科讯】MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

地址:http://www.miutrip.net.cn/news/366.html