news 2026/5/11 12:55:33

CANN/GE动态输入Python构图示例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/GE动态输入Python构图示例

样例使用指导

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

1、功能描述

本样例使用动态输入算子进行构图,旨在帮助构图开发者快速理解动态输入的定义和使用

2、目录结构

python/ ├── src/ | └── make_concatv2_graph.py // sample文件 ├── CMakeLists.txt // 编译脚本 ├── README.md // README文件 ├── run_sample.sh // 执行脚本

3、使用方法

3.1、准备cann包

  • 通过安装指导 环境准备正确安装toolkitops
  • 设置环境变量 (假设包安装在/usr/local/Ascend/)
source /usr/local/Ascend/cann/set_env.sh

3.2、编译和执行

  • 注:和 C/C++构图对比,Python构图需要额外添加 LD_LIBRARY_PATH 和 PYTHONPATH(参考sample中的配置方式)
bash run_sample.sh -t sample_and_run_python

该命令会:

  1. 自动生成ES接口
  2. 编译sample程序
  3. 生成dump图并运行该图

执行成功后会看到:

[Success] sample 执行成功,pbtxt dump 已生成在当前目录。该文件以 ge_onnx_ 开头,可以在 netron 中打开显示
输出文件说明

执行成功后会在当前目录生成以下文件:

  • ge_onnx_*.pbtxt- 图结构的protobuf文本格式,可用netron查看

3.3、日志打印

可执行程序执行过程中如果需要日志打印来辅助定位,可以在bash run_sample.sh -t sample_and_run_python之前设置如下环境变量来让日志打印到屏幕

export ASCEND_SLOG_PRINT_TO_STDOUT=1 #日志打印到屏幕 export ASCEND_GLOBAL_LOG_LEVEL=0 #日志级别为debug级别

3.4、图编译流程中DUMP图

可执行程序执行过程中,如果需要DUMP图来辅助定位图编译流程,可以在bash run_sample.sh -t sample_and_run_python 之前设置如下环境变量来DUMP图到执行路径下

export DUMP_GE_GRAPH=2

4、核心概念介绍

4.1、构图步骤如下:

  • 创建图构建器(用于提供构图所需的上下文、工作空间及构建相关方法)
  • 添加起始节点(起始节点指无输入依赖的节点,通常包括图的输入(如 Data 节点)和权重常量(如 Const 节点))
  • 添加中间节点(中间节点为具有输入依赖的计算节点,通常由用户构图逻辑生成,并通过已有节点作为输入连接)
  • 设置图输出(明确图的输出节点,作为计算结果的终点)

4.2、动态输入

概念说明:动态输入是指某些算子的输入个数不固定;例如 ConcatV2 算子,该算子为动态多输入算子

ConcatV2 算子的原型如下所示,ES 构图生成的API是ConcatV2(),支持在 Python 中使用

REG_OP(ConcatV2) .DYNAMIC_INPUT(x, TensorType({BasicType(), DT_BOOL, DT_STRING})) .INPUT(concat_dim, TensorType::IndexNumberType()) .OUTPUT(y, TensorType({BasicType(), DT_BOOL, DT_STRING})) .ATTR(N, Int, 1) .OP_END_FACTORY_REG(ConcatV2)

其对应的函数原型为:

  • 函数名:ConcatV2
  • 参数:共 3 个,依次为 x, concat_dim, N
  • 返回值:输出 y

Python API中:

ConcatV2(x: List[Union[TensorHolder, TensorLike]], concat_dim: Union[TensorHolder, TensorLike], *, N: int =1) -> TensorHolder:

注: 1.使用TensorLike类型表达输入,以支持实参可以直接传递数值的情况

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 12:53:30

3天搞定中文API大全:从菜鸟到高手的完整指南

3天搞定中文API大全:从菜鸟到高手的完整指南 嘿,开发者!你是不是经常为找一个好用的API而烦恼?项目做到一半,突然发现某个API文档全是英文,看得头大?别担心,今天我要给你介绍一个超级…

作者头像 李华
网站建设 2026/5/11 12:51:40

冻肉切丁机厂家经营破局:成本与市场双维策略深度解析

冻肉切丁机厂家经营破局:成本与市场双维策略深度解析“冻肉切丁机厂家破局,不是靠降价抢单,而是用‘定制化全链路服务’重构竞争壁垒”当前冻肉切丁机市场竞争白热化,厂家面临成本高企、同质化严重、客户留存难等痛点。如何在成本…

作者头像 李华
网站建设 2026/5/11 12:50:37

告别同义词替换!我实测了3款降AI工具,英文论文稳过Turnitin检测

最近这几天博主快被turnitin检测ai率搞到心态崩了,上周文章初稿提交前,因为自己写的内容用词太规范,结果被Turnitin查出了80%的AI率,这要是交上去肯定会被打回。 担心之余我赶紧开始找免费降ai率工具和怎么给英文降ai…

作者头像 李华
网站建设 2026/5/11 12:49:55

UNet3+全解析:从结构创新到医学图像分割实战

1. UNet3为什么能成为医学图像分割的新标杆? 第一次看到UNet3的论文时,我正被一个肝脏CT分割项目折磨得焦头烂额。当时试过UNet、UNet、Attention UNet等各种变体,但总在一些微小病灶的边界分割上差强人意。直到把UNet3的代码跑起来&#xff…

作者头像 李华