news 2026/6/15 19:23:49

JVET-AI0084

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
JVET-AI0084

一、ALF 的原有问题(ECM-13.0 中存在的问题)

1. APS-ALF 系数跨帧复用但缺乏自适应能力

在 ECM-13.0 中:

  • 非固定 APS-ALF 的滤波系数:

    • 由编码器针对某一帧优化
    • 可被后续多帧复用
  • 解码端对所有使用该 APS 的帧:

    • 以相同强度应用 ALF 校正

👉 问题在于:

不同帧在内容特性、QP、噪声水平上存在显著差异,而滤波强度保持不变


2. 滤波强度不匹配导致 RD 性能受限

具体表现为:

  • 对某些帧:

    • ALF 校正偏弱,去噪不足
  • 对另一些帧:

    • ALF 校正偏强,产生过平滑
  • 这种失配:

    • 无法通过 CTU 级 ALF on/off 完全解决
    • 影响整体 RD 性能

📌 本质问题:

ALF 只能“开或关”,但“强度不可调”


3. 重新估计 APS 系数代价高

  • 若为每帧重新生成 APS-ALF:

    • 增加编码复杂度
    • 增加 APS signaling 开销
  • ECM-13.0 中缺乏:

    • 轻量级的帧级强度调节机制

二、AI0084 提出的解决方法(ALF residuals scaling)

1. 核心思想:缩放 ALF 残差而非修改滤波器

AI0084 不改变:

  • ALF 滤波结构
  • APS-ALF 系数本身

而是对ALF 产生的校正残差引入缩放因子

rec′(s)=rec(s)+corr(s)⋅scale23 rec'(s) = rec(s) + \frac{corr(s) \cdot scale}{2^3}rec(s)=rec(s)+23corr(s)scale

其中:

  • (corr(s)):ALF 计算得到的校正残差
  • (scale):缩放因子

👉 实现“滤波强度可调”


2. 缩放因子的信令方式(轻量级)

(1)按 Slice 信令

  • 缩放因子在slice header中传输
  • 不引入 CTU 级额外信令

(2)Luma 支持按 class 分组缩放

  • luma 的 25 个 ALF class index:

    • 按组划分
    • 每组共享一个 scaling factor
  • 通过:

    • idxGroup决定组数
    • idxScale[n]指定每组缩放因子

📌 允许:

  • 不同纹理 / 活动度区域
  • 使用不同 ALF 强度

(3)Chroma 使用单一缩放因子

  • 每个 chroma 分量:

    • 仅信令一个 scaling factor
  • 控制复杂度和比特开销


3. 缩放因子查表实现,复杂度极低

  • 缩放因子值来自SPS 预定义表

  • 实现为:

    • 整数乘法 + 移位
  • 不引入额外浮点或复杂运算


4. 带来的效果

  • 不改变 APS-ALF 系数的前提下:

    • 适配不同帧特性
    • 改善 RD 性能
  • 实验结果表明:

    • RA / LDB / LDP 下均有稳定 BD-rate 降低
    • 编码与解码复杂度几乎不变

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 14:02:42

MediaPipe姿态识别误检规避:背景复杂场景优化策略

MediaPipe姿态识别误检规避:背景复杂场景优化策略 1. 背景与挑战:复杂环境下的人体姿态识别困境 随着AI视觉技术的普及,人体骨骼关键点检测在健身指导、动作分析、虚拟试衣和人机交互等场景中展现出巨大潜力。Google推出的MediaPipe Pose模…

作者头像 李华
网站建设 2026/6/15 12:27:50

MediaPipe Hands教程:检测

MediaPipe Hands教程:检测 1. 引言 1.1 AI 手势识别与追踪 在人机交互日益智能化的今天,手势识别作为自然交互方式的重要组成部分,正广泛应用于虚拟现实、智能驾驶、远程控制和无障碍交互等领域。相比传统的触控或语音输入,手势…

作者头像 李华
网站建设 2026/6/15 12:15:11

可访问性测试资源:构建无障碍数字世界的专业生态

——面向测试工程师的社区支持与技术工具深度解析 一、引言:可访问性测试的行业价值重塑 随着全球数字包容性立法加速(如欧盟EN 301 549、美国Section 508),可访问性测试已从道德诉求升级为法律强制要求。2026年全球无障碍技术市…

作者头像 李华
网站建设 2026/6/15 12:29:18

‌测试可访问性银行应用:面向软件测试从业者的专业实践指南

在金融数字化加速的今天,银行应用已成为用户获取金融服务的核心入口。然而,若应用未能满足可访问性标准,将直接导致数以亿计的残障用户被排除在金融服务之外。作为软件测试从业者,我们不仅是功能的验证者,更是数字包容…

作者头像 李华
网站建设 2026/6/15 14:42:41

可访问性测试自动化挑战:技术深水区与破局之道

无法回避的数字包容性战场 全球超10亿残障用户依赖辅助技术访问数字产品,欧盟EN 301 549、美国Section 508等法规强制要求合规。Gartner预测到2027年,75%的企业将因可访问性缺陷面临法律诉讼。在此背景下,自动化测试从效率工具升级为风险防控…

作者头像 李华
网站建设 2026/6/15 15:54:05

NX二次开发项目应用:批量处理脚本实战

NX二次开发实战:用Python脚本批量重命名部件并智能维护装配引用你有没有遇到过这样的场景?项目进入改型阶段,上百个零件需要统一加上版本号前缀;或是要将旧平台的数据迁移到新PLM系统,文件命名规范必须重构。手动一个个…

作者头像 李华