MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

数据库2025-11-05 09:24:439539

 近日,度世道冠莫斯科国立大学(Moscow State University)举办的界视军世界视频编码器大赛传来好消息,金山云自主研发的频编KAV1编码器在UGC赛道中拔得头筹。

MSU视频编码大赛是赛金山云C赛全球盛宴,在视频编码领域具有极大的斩获影响力,迄今已连续举办了15届,度世道冠每年都会吸引众多国内外重量级企业和组织参加。界视军

本次,频编金山云KAV1在UGC赛道中斩获冠军,赛金山云C赛不仅证明了金山云在视频编码领域的斩获团队实力与创新潜力,也让业界看到了AV1未来的度世道冠广泛应用前景。

在UGC赛道中排名问鼎

目前,界视军UGC(User Generated Content,频编用户原创内容)和PGC(Professionally Generated Content,专业生产内容)是赛金山云C赛互联网视频的两大主要来源。作为一种泛众化的斩获传播范式,UGC拍摄的低门槛能满足普通人自我表达的诉求,因为每一个人都可以用短视频这种最为简要、直观的形式与他人和社会分享自己的观点与生活。事实上,在抖音、快手、企商汇B站等视频类社交平台,无论是长视频还是短视频,用户参与(UGC)都是更大的比重。

除了内容来源不同,PGC视频和UGC视频的区别更在于整体质量的差异。PGC视频在拍摄时就会选择更佳的光照对比度和合理的动静场景比例,在制作初期也会采用专业的编码手段来确保压制质量。与之相比,UGC的拍摄制作、压制和后期效果都是由非专业人员完成,缺少对拍摄环境的把关,制作初期会存在对焦失真、模糊和噪声大等问题,在处理过程中也会经历多次视频转码,其难度也会随着转码次数的变多而增大。

尽管如此,鉴于全球视频云服务中的主要流量是UGC,因此关注UGC编码能够更贴合实际业务场景,IT技术网这也是MSU大赛UGC赛道的初衷。本次UGC赛道视频取自数个互联网头部高自由度原创视频平台,通过沿用MSU一贯使用的时空复杂度聚类方法获得,它们覆盖了多种场景。

本次UGC赛道结果显示,金山云KAV1在人工评测中压缩率较Reference(X265)提升41%(去年主观赛道冠军相较于X265的提升是33%),相对于svt-av1、VP9和x264分别提升45%、71%和73%,这足以展示金山云KAV1在UGC赛道中相较于其他编码器的优势。

MSU大赛现有的主观、客观、4K等赛道主要集中在AV1、VVC中,这些编码器均是为了4K、8K等高清视频而生,在一些低清场景下,其优势可能不如目前流行的x265等编码器明显。金山云KAV1作为AV1标准的自研编码器,虽然是以“一切为了高清”为目标,却也能在UGC场景中优势明显。据悉,免费信息发布网为了本次MSU赛事,金山云专业的视频编码器研发团队在编码器和AI两个方向上取长补短,研制出了贴合人眼感知模型的KAV1。

金山云KAV1第一次参加编码器领域盛宴就能取得不俗的成绩,这表明,近年来金山云在AI和编解码方面的研发持续收获成效。

KAV1的背后功臣:感知评价指标KPA

对焦失真、模糊、噪声、场景区分巨大等因素,导致UGC视频的主观优化成为较PGC视频更有挑战性的一环。为了更好地优化UGC场景的编码效果,金山云自主研发并且发布了图像视频感知评价指标Kingsoft Cloud Perceptual Assessment(KPA)。

本次MSU大赛中,利用KPA强大的能力,金山云KAV1在继承经典视频混合框架的基础上,基于KPA重新设计了RDO目标函数,同时利用JND+KPA两者大幅度去除了人眼不感知的区域所占用的码率,包括时域空域的采集噪声、压缩带来的压缩噪声、暗场和高频集中等不敏感区域。同时,全面提升了预测、变换、量化、熵编码等各个流程的压缩效率,如采取 Warp Motion 技术提升对局部仿射运动的估计;增加 DCT-8/DST-7等变换提升残差的变换效率;精细调整每一个编码单元的QP以获得更为优良的码率分配;革新熵编码机制超越经典 CABAC 算数码。通过这些手段,金山云KAV1在确保压缩率的基础上大大提升了图像画质。

(左侧) x265编码后的图像 (右侧)金山云KAV1编码后的图像

目前,能够达到商用级的评价指标非常少,学术界的评价指标主要都是针对有非常明确边界条件约束的场景。商用级的全参考评价指标目前除了PSNR和SSIM之外,就是Netflix在2016年发布的VMAF,然而VMAF是主要针对Netflix的PGC场景进行设计的,无法直接用在UGC视频当中。KPA主要针对UGC视频,并且除了通用的整体质量评价外,还包括子维度质量、局部质量等细分评价指标。

在KPA的研发过程中,通过收集各种场景下UGC及PGC视频,并保证至少50以上的专业评测人员对每个视频进行主观评测,从源头上避免数据主观评测波动和精度问题。同时,对收集到的数据,从内容、场景、质量等多个维度进行平衡筛选,在确保数据规模远超业界开源数据的基础上,提升数据的多样性。在模型层面,通过攻防设计、协同学习、困难样本挖掘等方法,提升模型的鲁棒性和精度,在UGC场景中SROCC和gMAD分数均优于业界知名的有参考算法VMAF。

在视频高清化的趋势下,用户对视频的要求在不断提升,这就会对视频编解码技术提出越来越高的要求。基于在视频编解码方面的优势,金山云始终坚持技术立业,一直在不断探索核心技术,寻求持续突破。

本文地址:http://www.bzve.cn/html/1c64499354.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

热门文章

全站热门

以利勃登音响——领先音响技术的杰出代表(探索以利勃登音响的高品质声音与卓越性能)

戴尔商用系统软硬一体化解决方案 助力PEC提升社区的整体服务能力

全球首张!超聚变服务器获TÜV莱茵防泄漏认证证书

2022ODCC峰会上,华为为数据中心持续进化提供了哪些解题思路

假如你是一个测试入侵侦测系统或一些网络访问控制策略的网络管理员,那么你经常需要抓取数据包并在离线状态下分析这些文件。当需要保存捕获的数据包时,我们一般会存储为 libpcap 的数据包格式 pcap,这是一种被许多开源的嗅探工具以及捕包程序广泛使用的格式。假如 pcap 文件被用于入侵测试或离线分析的话,那么在将他们注入网络之前通常要先对 pcap 文件进行一些操作。在该文中,我将介绍一些操作 pcap 文件的工具,以及如何使用它们 。Editcap 与 MergecapWireshark,是最受欢迎的 GUI 嗅探工具,实际上它带了一套非常有用的命令行工具集。其中包括 editcap 与 mergecap。editcap 是一个万能的 pcap 编辑器,它可以过滤并且能以多种方式来分割 pcap 文件。mergecap 可以将多个 pcap 文件合并为一个。 该文就是基于这些 Wireshark 命令行工具的。假如你已经安装过 Wireshark 了,那么这些工具已经在你的系统中了。假如还没装的话,那么我们接下来就安装 Wireshark 命令行工具。 需要注意的是,在基于 Debian 的发行版上我们可以不用安装 Wireshark GUI 而仅安装命令行工具,但是在 Red Hat 及 基于它的发行版中则需要安装整个 Wireshark 包。Debian, Ubuntu 或 Linux Mint复制代码代码如下:$ sudo apt-get install wireshark-commonFedora, CentOS 或 RHEL复制代码代码如下:$ sudo yum install wireshark当安装好工具后, 就可以开始使用 editca 与 mergecap 了。pcap 文件过滤通过 editcap, 我们能以很多不同的规则来过滤 pcap 文件中的内容,并且将过滤结果保存到新文件中。首先,以“起止时间”来过滤 pcap 文件。 - A < start-time >和 - B < end-time >选项可以过滤出在这个时间段到达的数据包(如,从 2:30 ~ 2:35)。时间的格式为 “ YYYY-MM-DD HH:MM:SS。复制代码代码如下:$ editcap -A 2014-12-10 10:11:01 -B 2014-12-10 10:21:01 input.pcap output.pcap 也可以从某个文件中提取指定的 N 个包。下面的命令行从 input.pcap 文件中提取100个包(从 401 到 500)并将它们保存到 output.pcap 中:复制代码代码如下:$ editcap input.pcap output.pcap 401-500使用 -D < dup-window > (dup-window可以看成是对比的窗口大小,仅与此范围内的包进行对比)选项可以提取出重复包。每个包都依次与它之前的 < dup-window >-1 个包对比长度与MD5值,假如有匹配的则丢弃。复制代码代码如下:$ editcap -D 10 input.pcap output.pcap 遍历了 37568 个包, 在 10 窗口内重复的包仅有一个,并丢弃。也可以将 < dup-window >定义成时间间隔。使用-w < dup-time-window >选项,对比< dup-time-window >时间内到达的包。复制代码代码如下:$ editcap -w 0.5 input.pcap output.pcap 检索了 50000 个包, 以0.5s作为重复窗口,未找到重复包。分割 pcap 文件当需要将一个大的 pcap 文件分割成多个小文件时,editcap 也能起很大的作用。将一个 pcap 文件分割成数据包数目相同的多个文件复制代码代码如下:$ editcap -c 输出的每个文件有相同的包数量,以 < output-prefix >-NNNN的形式命名。以时间间隔分割 pcap 文件复制代码代码如下: $ editcap -i 合并 pcap 文件假如想要将多个文件合并成一个,用 mergecap 就很方便。当合并多个文件时,mergecap 默认将内部的数据包以时间先后来排序。复制代码代码如下:$ mergecap -w output.pcap input.pcap input2.pcap [input3.pcap . . .]假如要忽略时间戳,仅仅想以命令行中的顺序来合并文件,那么使用 -a 选项即可。例如,下列命令会将 input.pcap 文件的内容写入到 output.pcap, 并且将 input2.pcap 的内容追加在后面。复制代码代码如下:$ mergecap -a -w output.pcap input.pcap input2.pcap 总结在这篇指导中,我演示了多个 editcap、 mergecap 操作 pcap 文件的例子。除此之外,还有其它的相关工具,如 reordercap用于将数据包重新排序,text2pcap 用于将 pcap 文件转换为文本格式, pcap-diff用于比较 pcap 文

戴尔Precision 5570 让SOLIDWORKS等三维软件发挥最大潜能

WAIC2022智能流体力学产业联合体成立,以昇腾AI使能科研创新

国际高性能计算和人工智能咨询委员会公布第五届亚太区 HPC-AI竞赛结果

友情链接

滇ICP备2023006006号-39