news 2026/5/9 14:56:33

CANN/ATVOSS乘法运算API文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ATVOSS乘法运算API文档

Mul

【免费下载链接】atvossATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。项目地址: https://gitcode.com/cann/atvoss

功能说明

乘法运算,支持张量*张量,张量*标量,标量*张量。

所属头文件链接

/include/operators/math_expression.h

函数原型

template<typename T, typename U> struct OpMul : BinaryOp<T, U> template<typename T, typename U> __host_aicore__ constexpr auto operator*(Expression<T> lhs, Expression<U> rhs) template<typename T, typename U> __host_aicore__ constexpr auto operator*(Expression<T> lhs, U &&rhs) template<typename T, typename U> __host_aicore__ constexpr auto operator*(T &&lhs, Expression<U> rhs)

参数说明

参数名称参数类型输入/输出数据类型参数说明默认值
T模板参数输入NA乘法左操作数数据类型NA
U模板参数输入NA乘法右操作数数据类型NA
lhs函数形参输入NA乘法左操作数,当类型是Expression<T>时,是张量,当类型是T时,是标量NA
rhs函数形参输入NA乘法右操作数,当类型是Expression<U>时,是张量,当类型是U时,是标量NA

返回值说明

返回值数据类型返回值说明
Expression >返回一个OpMul的表达式

约束说明

不支持广播

使用示例

template <typename InputDtype, typename OutputDtype> struct Config { struct Compute { template <template <typename> class Tensor> __host_aicore__ constexpr auto Compute() const { auto in1 = Atvoss::PlaceHolder<1, Tensor<InputDtype>, Atvoss::ParamUsage::IN>(); auto in2 = Atvoss::PlaceHolder<2, Tensor<InputDtype>, Atvoss::ParamUsage::IN>(); auto out = Atvoss::PlaceHolder<3, Tensor<OutputDtype>, Atvoss::ParamUsage::OUT>(); // 🔥🔥🔥 使用示例 🔥🔥🔥 return (out = in1 * in2); // 🔥🔥🔥 使用示例 🔥🔥🔥 }; }; }; template <typename InputDtype, typename OutputDtype> struct Config { struct Compute { template <template <typename> class Tensor> __host_aicore__ constexpr auto Compute() const { auto in = Atvoss::PlaceHolder<1, Tensor<InputDtype>, Atvoss::ParamUsage::IN>(); auto scalar = Atvoss::PlaceHolder<2, InputDtype, Atvoss::ParamUsage::IN>(); auto out = Atvoss::PlaceHolder<3, Tensor<OutputDtype>, Atvoss::ParamUsage::OUT>(); // 🔥🔥🔥 使用示例 🔥🔥🔥 return (out = in * scalar); // 🔥🔥🔥 使用示例 🔥🔥🔥 }; }; }; template <typename InputDtype, typename OutputDtype> struct Config { struct Compute { template <template <typename> class Tensor> __host_aicore__ constexpr auto Compute() const { auto in = Atvoss::PlaceHolder<1, Tensor<InputDtype>, Atvoss::ParamUsage::IN>(); auto scalar = Atvoss::PlaceHolder<2, InputDtype, Atvoss::ParamUsage::IN>(); auto out = Atvoss::PlaceHolder<3, Tensor<OutputDtype>, Atvoss::ParamUsage::OUT>(); // 🔥🔥🔥 使用示例 🔥🔥🔥 return (out = scalar * in); // 🔥🔥🔥 使用示例 🔥🔥🔥 }; }; };

【免费下载链接】atvossATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。项目地址: https://gitcode.com/cann/atvoss

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:54:30

NATLINEAR南麟 LN2401AMR-G SOT23-5 降压恒流驱动器

产品特点 高效率 最大效率可达92% 大的输出电流甚小静态电流低压操作 800mA 200uA 可达100%占空比 PWM/PFM 自动切换 占空比自动可调以保持很大负 载范围内的高效率、低纹波

作者头像 李华
网站建设 2026/5/9 14:47:58

完整示例:带 Tiling 模板、属性、Workspace 的 Clamp 算子

完整示例&#xff1a;带 Tiling 模板、属性、Workspace 的 Clamp 算子 【免费下载链接】cann-learning-hub CANN 学习中心仓&#xff0c;支持在线互动运行、边学边练&#xff0c;提供教程、示例与优化方案&#xff0c;一站式助力昇腾开发者快速上手。 项目地址: https://gitc…

作者头像 李华
网站建设 2026/5/9 14:46:19

可信AI评估标准:从欧盟七原则到可操作分类体系的实践指南

1. 项目概述&#xff1a;为什么我们需要“可信AI”的标尺&#xff1f;在AI技术渗透到医疗诊断、金融风控、自动驾驶乃至内容创作等各个角落的今天&#xff0c;一个核心问题日益凸显&#xff1a;我们如何信任这些由代码和数据驱动的决策&#xff1f;当AI系统开始影响就业、信贷、…

作者头像 李华
网站建设 2026/5/9 14:45:47

WorldStereo数据集与3D视频生成技术解析

1. 项目概述WorldStereo数据集是近年来计算机视觉领域备受关注的一个多视角立体视觉数据集&#xff0c;它为3D视频生成技术的研究提供了重要的数据支撑。这个数据集包含了大量真实场景的多视角同步拍摄视频序列&#xff0c;覆盖了室内外各种复杂环境&#xff0c;为深度估计、立…

作者头像 李华
网站建设 2026/5/9 14:44:41

Ceph 对象存储深度解析系列 第二部分:RGW 数据路径、分片和自动化

新钛云服已累计为您分享896篇技术干货简介在本深度解析的第一部分中&#xff0c;我们剖析了 Ceph RGW 内部的高性能请求路径。我们涵盖了其无状态前端、基础 RADOS 存储池以及关键的桶索引&#xff0c;揭示了动态分片如何使单个桶内的对象列表实现几乎无限的可扩展性。我们确立…

作者头像 李华