news 2026/5/11 3:57:22

CANN/GE查询模型内存分区

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/GE查询模型内存分区

aclmdlQueryExeOMDesc

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品

是否支持

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

功能说明

根据模型文件获取模型执行时所需的工作内存、权值内存、模型描述信息、静态和动态shape任务等的内存大小。

函数原型

aclError aclmdlQueryExeOMDesc(const char *fileName, aclmdlExeOMDesc *mdlPartitionSize)

参数说明

参数名

输入/输出

说明

fileName

输入

模型文件路径的指针,路径中包含文件名。运行程序(APP)的用户需要对该路径有访问权限。

此处的模型文件是适配昇腾AI处理器的离线模型,即*.exeom文件。

mdlPartitionSize

输出

模型执行时所需的各分区大小的结构体指针,分区大小单位为Byte。

返回值说明

返回0表示成功,返回其他值表示失败,请参见aclError。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 3:52:31

ARM GICv3中断控制器与ICC_BPR1寄存器详解

1. ARM GICv3中断控制器架构概述在ARM架构的现代处理器中,通用中断控制器(GIC)是管理硬件中断的核心组件。GICv3作为当前主流的版本,相比前代架构进行了多项重要改进:支持更多处理器核心(理论上可达128个PE)改进的中断…

作者头像 李华
网站建设 2026/5/11 3:51:34

AI知识库构建实战:从RAG原理到企业级应用部署

1. 项目概述:一个面向AI的知识库构建方案最近在折腾AI应用开发,特别是想搞点能“记住”东西的智能助手。我发现很多朋友和我一样,对如何让AI模型(比如大语言模型)访问和利用我们自己的文档、笔记、公司资料这些私有知识…

作者头像 李华
网站建设 2026/5/11 3:50:34

观察Taotoken用量看板如何清晰展示各模型调用量与费用分布

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 观察Taotoken用量看板如何清晰展示各模型调用量与费用分布 对于使用多个大模型API的开发者或团队而言,清晰、及时地了解…

作者头像 李华
网站建设 2026/5/11 3:50:33

SREWorks网关组件详解:构建高可用微服务治理体系 [特殊字符]

SREWorks网关组件详解:构建高可用微服务治理体系 🚀 【免费下载链接】SREWorks Cloud Native DataOps & AIOps Platform | 云原生数智运维平台 项目地址: https://gitcode.com/gh_mirrors/sr/SREWorks 在云原生时代,微服务架构已…

作者头像 李华
网站建设 2026/5/11 3:43:43

CANN/ops-math OneHot算子

OneHot 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√…

作者头像 李华
网站建设 2026/5/11 3:42:32

基于Godot引擎的即时战略游戏框架开发实战指南

1. 项目概述:当上帝视角遇上即时战略如果你是一个游戏开发者,或者对游戏开发抱有浓厚兴趣,那么“即时战略”(RTS)这个类型对你来说一定不陌生。从经典的《星际争霸》、《帝国时代》到后来的《魔兽争霸》,这…

作者头像 李华