news 2026/5/9 22:30:33

CANN昇腾模型压缩工具包AMCT

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN昇腾模型压缩工具包AMCT

AMCT

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

🔥Latest News

  • [2025/4/24] 支持将deepseekv4模型量化为int8。
  • [2025/4/17] 支持HiFloat8分位量化(quantile)算法。
  • [2025/3/2] 支持HiFloat8数据直转(cast)算法。
  • [2025/2/2] 支持HiFloat8/FP8/FP4数据量化。
  • [2025/12/22] AMCT项目首次上线。

🚀概述

AMCT(Ascend Model Compression Toolkit,简称AMCT)是一款昇腾AI处理器亲和的深度学习模型压缩工具包,提供多种模型量化压缩特性。压缩后模型体积变小,部署到昇腾AI处理器可使能低比特运算,提高计算效率,达到性能提升的目标。AMCT部署架构图如下:

🔍目录结构

├── docs # AMCT工具文档介绍 ├── README.md ├── build.sh # 工程编译脚本 ├── requirements.txt # 环境搭建需要的第三方依赖包 ├── amct_pytorch # 源码 ├── npu_ops # 算法对应的算子代码 ├── examples # 端到端样例开发和调用示例 └── tests # 测试工程目录

⚡️快速开始

若您希望快速体验该工具的使用和样例执行,请访问如下文档获取简易教程:

  • 构建验证:介绍工具的完整构建、测试样例运行流程。
  • 样例执行:介绍如何端到端执行样例代码。

📖学习教程

若您希望深入了解AMCT工具的使用方法,请参见介绍:

  • 压缩概念介绍:介绍压缩特性相关的概念,比如什么是量化,什么是稀疏等。
  • 压缩特性介绍:介绍AMCT工具支持的压缩特性。
  • 压缩接口介绍:介绍使用的压缩接口。
  • 压缩算法介绍:介绍AMCT压缩过程中使用的算法,比如AWQ、GPTQ等。

📝相关信息

  • 贡献指南
  • 安全声明
  • 许可证

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 22:30:15

自动驾驶可解释AI:从黑盒模型到透明决策的工程实践

1. 项目概述:当“黑盒”遇上方向盘最近和几个做自动驾驶感知和规控的朋友聊天,大家不约而同地提到了一个共同的焦虑:模型越来越准,但心里越来越没底。这感觉就像你请了一位驾驶技术出神入化的老司机,但他从不告诉你为什…

作者头像 李华
网站建设 2026/5/9 22:26:34

10分钟自动化部署OpenClaw AI助手:基于Ubuntu VPS的完整实践指南

1. 项目概述:一键部署你的专属AI助手 如果你和我一样,对AI Agent(智能体)的潜力感到兴奋,但又对在服务器上手动配置、安装、调试的繁琐过程感到头疼,那么这个项目就是为你准备的。 ortegarod/openclaw-vp…

作者头像 李华
网站建设 2026/5/9 22:21:32

CANN/cann-samples MoE通信优化实践

moe dispatch 和 combine 通信算子性能优化实践与效果分析 【免费下载链接】cann-samples 算子领域高性能实战演进样例与体系化调优知识库 项目地址: https://gitcode.com/cann/cann-samples 背景介绍 在大模型训练与推理中,MoE(Mixture-of-Expe…

作者头像 李华
网站建设 2026/5/9 22:16:09

CANN Qwen3-next推理优化

NPU Qwen3-next推理优化实践 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 阿里千问团队发布了 Qwen3-Next 模型&…

作者头像 李华
网站建设 2026/5/9 22:08:11

魔兽争霸3完整优化方案:5步实现高帧率与宽屏体验

魔兽争霸3完整优化方案:5步实现高帧率与宽屏体验 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 你是否还在忍受魔兽争霸3在现代化硬件上的…

作者头像 李华
网站建设 2026/5/9 22:03:45

Taotoken API Key 的精细化管理与访问控制实践

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken API Key 的精细化管理与访问控制实践 在团队协作与多项目并行的开发环境中,大模型 API 密钥的管理往往成为一…

作者头像 李华