news 2026/5/9 15:39:35

CANN/ops-blas tpmv算子测试

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-blas tpmv算子测试

tpmv算子实现

【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas

概述

BLAS tpmv算子实现。

tpmv(Triangular Packed Matrix-Vector Multiplication)算子实现了三角矩阵与向量的乘法运算,是BLAS基础线性代数库中的核心算子之一。

该算子针对对称矩阵的存储特性进行了优化,采用压缩存储格式以节省内存空间,并高效完成矩阵与向量的乘加运算。

支持的产品

  • Atlas A3 训练系列产品/Atlas A3 推理系列产品
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品

目录结构介绍

├── tpmv │ ├── CMakeLists.txt // 编译工程文件 │ ├── README.md // 说明文档 │ └── tpmv_test.cpp // 算子调用样例

算子描述

  • 算子功能:
    tpmv算子实现了将三角矩阵乘以向量。对应的数学表达式为:
y = A * x

A为三角压缩矩阵,x是向量

三角矩阵A的下三角部分元素按行连续打包储存,元素A(i,j)储存在位置AP[j + i * (i + 1) / 2]中,且i >= j。压缩三角矩阵格式仅需要n * (n + 1) / 2个元素储存。

对应的接口为:

int aclblasTpmv(const float *aPacked, const float *x, float *y, const int64_t n, const int64_t incx, void *stream);
参数tpmv 参数说明
参数列表Param.Memoryin/out含义
nin对称压缩矩阵 A 的行数和列数。
aPackeddevicein对称压缩矩阵 <type> 数组,维度为 n x n。
xdevicein<type> 向量,包含 n 个元素。
incxinx 中连续元素之间的步长。
ydeviceout<type> 向量,包含 n 个元素。
  • 算子规格:

    算子类型(OpType)tpmv
    算子输入nameshapedata typeformat
    AN * (N + 1) /2floatND
    xNfloatND
    算子输出yNfloatND
    核函数名tpmv_kernel
  • 算子实现:

    将输入数据从A,x,y的GM地址分块搬运到UB,进行计算后再搬出到z所在的GM地址。

  • 调用实现
    使用内核调用符<<<>>>调用核函数。

编译运行

在本样例根目录下执行如下步骤,编译并执行算子。

  • 配置环境变量
    请根据当前环境上CANN开发套件包的安装方式,选择对应配置环境变量的命令。

    • 默认路径,root用户安装CANN软件包

      source /usr/local/Ascend/cann/set_env.sh
    • 默认路径,非root用户安装CANN软件包

      source $HOME/Ascend/cann/set_env.sh
    • 指定路径install_path,安装CANN软件包

      source ${install_path}/cann/set_env.sh
  • 样例执行

    bash build.sh --ops=tpmv --run # --ops=<算子名> --run可选参数,执行测试样例

    执行结果如下,说明精度对比成功。

    [Success] Case accuracy is verification passed.

【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 15:35:45

GTA5线上小助手:模块化架构设计与高效游戏体验提升方案

GTA5线上小助手&#xff1a;模块化架构设计与高效游戏体验提升方案 【免费下载链接】GTA5OnlineTools GTA5线上小助手 项目地址: https://gitcode.com/gh_mirrors/gt/GTA5OnlineTools GTA5线上小助手是一款专为《侠盗猎车手5》线上模式设计的开源辅助工具&#xff0c;通…

作者头像 李华
网站建设 2026/5/9 15:35:35

CANN/oam-tools HCCL测试工具

HCCL Test 【免费下载链接】oam-tools 本项目为开发者提供故障定位工具&#xff0c;包含故障信息收集&#xff0c;软硬件信息展示&#xff0c;AI core error报错分析等能力&#xff0c;提升故障问题定位效率&#xff0c;文档可在昇腾社区搜索“故障处理简介”&#xff08;选择社…

作者头像 李华
网站建设 2026/5/9 15:35:29

医疗AI可解释性实践:基于影像的生物年龄预测与XAI技术解析

1. 项目概述&#xff1a;当AI预测你的年龄&#xff0c;我们如何相信它&#xff1f;最近几年&#xff0c;AI在医疗健康领域的应用越来越火&#xff0c;从辅助诊断到药物研发&#xff0c;似乎无所不能。但有一个问题始终困扰着医生和研究者&#xff1a;AI模型很多时候像个“黑箱”…

作者头像 李华
网站建设 2026/5/9 15:34:59

CANN基础算子贡献指南

贡献指南 【免费下载链接】community 本项目是CANN开源社区的核心管理仓库&#xff0c;包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息 项目地址: https://gitcode.com/cann/community 本项目欢迎广大开发者体验并参与贡献&#xff0c;在参与社区贡献…

作者头像 李华
网站建设 2026/5/9 15:34:35

从工具到伙伴:通用人工智能的技术原理、瓶颈与风险治理

1. 从“工具”到“伙伴”&#xff1a;我们离真正的通用智能还有多远&#xff1f;作为一名在科技行业摸爬滚打了十几年的从业者&#xff0c;我亲眼见证了人工智能从实验室里的数学游戏&#xff0c;一步步变成我们手机里的语音助手、推荐算法和自动驾驶系统。今天&#xff0c;我想…

作者头像 李华