news 2026/5/10 5:45:47

CANN/atvoss RmsNorm算子样例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/atvoss RmsNorm算子样例

RmsNorm算子样例

【免费下载链接】atvossATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。项目地址: https://gitcode.com/cann/atvoss

概述

样例概述:本样例介绍了利用ATVOSS实现RmsNorm单算子并完成功能验证

  • 算子功能:RmsNorm算子是大模型常用的归一化操作,相比LayerNorm算子,其去掉了减去均值的部分
  • 调用方式:Kernel直调

样例支持的产品

  • Ascend 950PR/Ascend 950DT

算子描述

  • 算子数学计算公式: $$ \operatorname{RmsNorm}(x_i)=\frac{x_i}{\operatorname{Rms}(\mathbf{x})} g_i, \quad \text { where } \operatorname{Rms}(\mathbf{x})=\sqrt{\frac{1}{n} \sum_{i=1}^n x_i^2} $$

  • 算子规格:

参数名输入/输出/属性描述数据类型数据格式
in1输入表示进行归一化计算的输入。公式中的`x`。floatND
in2输入表示进行归一化计算的缩放因子(权重),公式中的`g`。floatND
out输出表示进行归一化后的最终输出,公式中的`RmsNorm(x)`。floatND
规格说明:
  • 当前只支持二维输入
  • 总的输入Shape(M, N)要满足:
    • M < 8160,N <= 7168
    • N需要32元素对齐
  • Tile块的Shape(m, n),要满足n = N,m * n <=7168
  • 目前只支持float类型

目录结构

文件名描述
rms_norm.cppRmsNorm样例算子代码实现
CMakeLists.txtRmsNorm样例算子的编译构建文件
README.mdRmsNorm样例算子的说明文档

RmsNorm样例算子的编译和运行

  • 编译 在代码仓根目录下执行:
bash scripts/build.sh -DSOC=ascend950 rms_norm
  • 运行 在代码仓目录下执行:
output/bin/rms_norm --help // 查看帮助 output/bin/rms_norm --shape=16,32 // 运行样例

【免费下载链接】atvossATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。项目地址: https://gitcode.com/cann/atvoss

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 5:45:46

CANN/runtime共享Buffer管理预留接口

20. 共享Buffer管理&#xff08;预留&#xff0c;暂不支持&#xff09; 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 本章节描述预留的共享 Buffer 管理接口&#xff08;当前版本暂不支持&#xff0…

作者头像 李华
网站建设 2026/5/10 5:43:46

CodeFire:为AI编程助手构建持久记忆层,实现连续协作开发

1. 项目概述&#xff1a;为AI编程助手构建持久记忆层 如果你和我一样&#xff0c;深度依赖Claude Code、Gemini CLI这类AI编程助手来辅助日常开发&#xff0c;那你一定遇到过这个让人头疼的问题&#xff1a;每次开启一个新的会话&#xff0c;AI助手就像得了“健忘症”&#xf…

作者头像 李华
网站建设 2026/5/10 5:42:45

泰州群利起重设备有限公司,升降货梯品质保障厂家究竟有何过人之处?

在工业重载垂直运输领域&#xff0c;升降货梯是不可或缺的重要设备。泰州群利起重设备有限公司作为专注于液压升降货梯研发、生产、销售与安装服务的专业制造企业&#xff0c;其过人之处体现在多个方面。一、产品技术与类型优势具体数据与案例泰州群利起重设备有限公司主营的液…

作者头像 李华
网站建设 2026/5/10 5:41:45

MySQL数据库开发工具箱:从环境配置到性能优化的完整工程实践

1. 项目概述&#xff1a;一个数据库开发者的工具箱最近在GitHub上看到了一个名为“MySQL_Development_Work”的项目&#xff0c;作者是puneetkumar041。作为一名长期与数据库打交道的开发者&#xff0c;我立刻被这个标题吸引了。它不像那些炫酷的AI项目或者全栈框架&#xff0c…

作者头像 李华
网站建设 2026/5/10 5:39:18

CANN/HCCL Pipeline流水线算法

Pipeline 【免费下载链接】hccl 集合通信库&#xff08;Huawei Collective Communication Library&#xff0c;简称HCCL&#xff09;是基于昇腾AI处理器的高性能集合通信库&#xff0c;为计算集群提供高性能、高可靠的通信方案 项目地址: https://gitcode.com/cann/hccl …

作者头像 李华
网站建设 2026/5/10 5:36:17

AI工作流编排框架aiflows:从消息驱动到DAG的智能应用开发实践

1. 项目概述&#xff1a;当AI工作流成为你的“智能副驾”最近在折腾AI应用开发的朋友&#xff0c;估计都绕不开一个核心痛点&#xff1a;想法很丰满&#xff0c;但落地很骨感。你构思了一个能自动分析周报、生成摘要、再根据摘要内容推荐下一步行动的多步AI应用&#xff0c;结果…

作者头像 李华