news 2026/5/9 13:24:15

CANN/ops-cv ROI对齐V2算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-cv ROI对齐V2算子

RoiAlignV2

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

产品支持情况

产品是否支持
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

  • 算子功能:对输入特征图执行 ROI Align 操作,对每个感兴趣区域(ROI)进行双线性插值采样,输出固定大小的特征图。
  • 输入 ROI 坐标格式为 <batch_index, x1, y1, x2, y2>(左上角和右下角坐标),在代码中以一维数组形式存储([numRois, 5] 维度展开为长度 numRois*5 的一维数据)。
  • 计算公式:
    • 输入节点:

      • features (shape[N, C, H, W], FLOAT32) - 输入特征图
      • rois (shape[numRois, 5], FLOAT32) - 感兴趣区域坐标(batch_index, x1, y1, x2, y2)
    • 计算节点:

      • Step1: 将 ROI 坐标乘以 spatial_scale 进行缩放,并转换为 (x, y, w, h) 格式;
      • Step2: 根据 pooled_height 和 pooled_width 将 ROI 区域划分为均匀的 bin,计算每个 bin 的宽高 (bin_w, bin_h);
      • Step3: 根据 sampling_ratio 确定每个 bin 内的采样网格大小 (grid_h, grid_w),若 sampling_ratio > 0 则固定为该值,否则自适应计算 (ceil(roi_h / pooled_height), ceil(roi_w / pooled_width));
      • Step4: 对每个 bin 内的每个采样点,计算其在特征图上的坐标,通过双线性插值获取特征值;
      • Step5: 对每个 bin 内所有采样点的特征值取平均,作为该位置的输出值;
      • 重复上述步骤直至所有 ROI 的所有通道处理完成。
    • 输出节点:

      • output (shape[numRois, C, pooled_height, pooled_width], FLOAT32) - 对齐后的 ROI 特征图

参数说明

参数名输入/输出/属性描述数据类型数据格式
features输入输入特征图,shape [N, C, H, W]。FLOAT32ND
rois输入感兴趣区域坐标,shape [numRois, 5],每行为 (batch_index, x1, y1, x2, y2)。FLOAT32ND
output输出对齐后的 ROI 特征图,shape [numRois, C, pooled_height, pooled_width]。FLOAT32ND
pooled_height属性(可选)输出特征图的高度。INT32-
pooled_width属性(可选)输出特征图的宽度。INT32-
spatial_scale属性(可选)空间缩放因子,用于将 ROI 坐标映射到特征图尺度。FLOAT-
sampling_ratio属性(可选)每个 bin 的采样点数。大于 0 时固定为该值,否则自适应计算。INT32-

约束说明

  • 目前只支持 float32 输入
  • 目前只支持 ascend910b

调用说明

调用方式调用样例说明
aclnn调用test_aclnn_roi_align_v2通过 aclnnRoiAlignV2 接口方式调用 RoiAlignV2 算子。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 13:21:31

CANN/atvc AclNNInvocationNaive工程样例

AclNNInvocationNaive工程样例 【免费下载链接】atvc ATVC&#xff08;Ascend C Templates for Vector Compute&#xff09;&#xff0c;是为基于Ascend C开发的典型Vector算子封装的一系列模板头文件的集合&#xff0c;可帮助用户快速开发典型Vector算子。 项目地址: https:…

作者头像 李华
网站建设 2026/5/9 13:19:45

大模型训练与数据

大模型研发本质是高投入、高不确定性、强理论依赖、长周期迭代的系统工程&#xff0c;必须靠实验室研究员的组合才能突破&#xff1b;其研发路径呈现先底座、后对齐、再工程化、持续迭代的强阶段性与规模化特征。一、为什么必须建实验室、用研究员&#xff1f; 1. 技术本质&…

作者头像 李华
网站建设 2026/5/9 13:18:49

CANN/ops-blas批量复数矩阵向量乘法

CgemvBatched算子实现 【免费下载链接】ops-blas 本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。 项目地址: https://gitcode.com/cann/ops-blas 概述 BLAS CgemvBatched算子实现。 CgemvBatched(批量复数矩阵-向量乘法)算子实现了批量复数矩阵与向…

作者头像 李华
网站建设 2026/5/9 13:16:30

通过用量看板观察不同模型API调用的成本与延迟表现

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 通过用量看板观察不同模型API调用的成本与延迟表现 对于使用多个大模型API的开发者而言&#xff0c;清晰、可量化的调用数据是进行…

作者头像 李华
网站建设 2026/5/9 13:12:30

Figma中文界面终极指南:3分钟让英文设计工具秒变中文

Figma中文界面终极指南&#xff1a;3分钟让英文设计工具秒变中文 【免费下载链接】figmaCN 中文 Figma 插件&#xff0c;设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而苦恼吗&#xff1f;FigmaCN是一款专为中文用户…

作者头像 李华