news 2026/5/9 21:22:35

ATB加速库多流Demo

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ATB加速库多流Demo

加速库多流Demo

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

该目录下为加速库多流功能demo,其中multiStream_singleGraph_demo.cpp中为图内多流并行Demo,multiStream_multiGraph_demo.cpp中为图间同步Demo。

图内多流并行

multiStream_singleGraph_demo.cpp

图间同步

multiStream_multiGraph_demo.cpp

使用说明

  • 首先source 对应的CANN和nnal包的安装路径

    • source [cann安装路径](默认为/usr/local/Ascend/ascend-toolkit)/set_env.sh
    • source [nnal安装路径] (默认为/usr/local/Ascend/nnal/atb) /set_env.sh
    • 如果使用加速库源码编译,source [源码路径]/output/atb目录下面的set_env.sh
  • 修改当前目录下的CMakeLists.txt中的add_executable

    • 如果想要运行图内多流并行示例将其修改为:

      add_executable(multiStreamDemo multiStream_singleGraph_demo.cpp)
    • 如果想要运行图间同步示例将其修改为:

      add_executable(multiStreamDemo multiStream_multiGraph_demo.cpp)
  • 生成构建系统

    • 使用cxx_abi=0

      mkdir build && cd build # 创建并且进入build目录 cmake .. -DUSE_CXX11_ABI=OFF # 生成构建系统
    • 使用cxx_abi=1

      mkdir build && cd build # 创建并且进入build目录 cmake .. -DUSE_CXX11_ABI=ON # 生成构建系统
  • 编译并运行

    cmake --build . # 编译项目 ./multiStreamDemo # 运行程序
  • 查看Profiling

    msprof --application="multiStreamDemo" # 生成profiling文件

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 21:22:11

从CC2530F256到.hex:IAR工程配置中那些新手必踩的坑与避坑指南

从CC2530F256到.hex:IAR工程配置中那些新手必踩的坑与避坑指南 当你第一次在IAR Embedded Workbench中为CC2530F256创建工程时,可能会觉得整个过程就像在迷宫中穿行。特别是当教程只告诉你"点击这里"、"选择那个",却不解…

作者头像 李华
网站建设 2026/5/9 21:16:00

基于零知识证明与Cardano的隐私优先AI赏金池系统NightPay实战指南

1. 项目概述:一个为AI智能体设计的隐私优先赏金池系统如果你正在寻找一种既能激励AI智能体完成特定任务,又能完全保护资金提供者隐私的解决方案,那么NightPay很可能就是你需要的工具。简单来说,NightPay是一个建立在Midnight隐私网…

作者头像 李华
网站建设 2026/5/9 21:08:30

开源3D模型实战:从GitHub资源到Unity/Blender高效应用与优化

1. 项目概述与核心价值 最近在GitHub上闲逛,发现了一个名为“amogus”的项目,作者是ViktorSmirnov71。这个项目名听起来有点无厘头,源自一个网络迷因,但点进去一看,发现它其实是一个关于“Among Us”游戏角色&#xff…

作者头像 李华
网站建设 2026/5/9 21:02:38

三步搭建Sunshine游戏串流服务器:从零开始享受跨平台游戏体验

三步搭建Sunshine游戏串流服务器:从零开始享受跨平台游戏体验 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 你是否曾梦想在任何设备上流畅运行高性能PC游戏&#xff…

作者头像 李华
网站建设 2026/5/9 21:01:46

CANN MXFP4量化矩阵乘教程

MXFP4 量化矩阵乘教程:流水分析与分步优化 【免费下载链接】cann-samples 算子领域高性能实战演进样例与体系化调优知识库 项目地址: https://gitcode.com/cann/cann-samples 本文档整理各 Step 的 问题背景、优化思路与流水对照;编译、安装与运行…

作者头像 李华
网站建设 2026/5/9 21:01:38

移动干扰源定位系统:原理、配置与实战技巧

1. 移动干扰源定位系统概述在无线通信网络运维中,信号干扰始终是影响网络性能的关键因素。无论是非法发射设备还是无意产生的射频干扰,都会导致基站接收机灵敏度下降、通话掉线率上升以及数据传输速率降低等问题。传统的人工干扰排查方式需要技术人员携带…

作者头像 李华