news 2026/5/10 4:54:41

CANN训练优化样例集

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN训练优化样例集

cann-recipes-train

【免费下载链接】cann-recipes-train本项目针对LLM与多模态模型训练业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-train

🚀 Latest News

  • [2026/04] 新增DeepSeek-V3模型MXFP8/HiF8 低精度预训练样例。
  • [2026/04] 新增DeepSeek-V4-Flash模型续训练0day支持(基于torchtitan框架)样例,支持训练入图、AutoFuse特性。
  • [2026/02] 新增DeepSeek-V3.2模型torchtitan框架预训练样例。
  • [2026/02] 新增Qwen3系列模型RL训练使能npugraph_ex图模式样例。
  • [2025/12] 新增Qwen2.5/Qwen3模型Code RL长上下文代码生成强化学习样例。
  • [2025/12] 新增Qwen3系列模型RL训练使能SAM投机推理、tool agent RL样例。
  • [2025/11] Qwen3模型长序列RL样例首次上线。
  • [2025/10] DeepSeek-R1、Qwen2.5模型样例首次上线。

🎉 概述

cann-recipes-train仓库旨在针对LLM与多模态模型训练业务中的典型模型、算法,提供基于CANN平台的优化样例,方便开发者简单、快速、高效地使用CANN平台进行模型训练。

✨ 实践列表

实践简介
DeepSeek-R1 RL训练优化样例基于开源veRL框架,搭配MindSpeed+vLLM-Ascend框架,在Atlas A3集群实现GRPO算法的高吞吐RL训练,并达到120TPS/卡的系统吞吐量。
基于verl框架的Qwen2.5强化学习(入门样例)基于Qwen2.5-1.5B-Instruct模型,采用verl强化学习框架,在MATH-lighteval数学推理数据集上进行了训练。本样例只需要单卡Atlas A2环境,帮助大家快速上手,使用昇腾NPU完成RL训练任务。
Qwen3-235B-A22B RL训练优化样例基于开源veRL框架,搭配MindSpeed+vLLM-Ascend框架,在Atlas A3集群实现GRPO/DAPO算法的长序列 2k+32k训练,GRPO达到120TPS/卡的系统吞吐量。
Qwen3-32B RL训练使能SAM投机推理样例基于开源veRL框架,搭配MindSpeed+vLLM-Ascend框架,在Atlas A3集群,GRPO/DAPO算法的2k+32k训练场景下,使能SAM投机推理特性,达成10%性能提升
Qwen3 tool agent RL训练样例基于verl/recipe中的retool项目,调用Sandbox工具,使能asyncLLMagent_loop特性,在昇腾NPU上完成端到端agent RL训练任务。
基于ScaleBox沙盒的Code RL训练样例基于verl框架和ScaleBox代码沙盒,支持长上下文(2k+16k) Code RL训练,Qwen3-30B-A3B在LiveCodeBench上Pass@1从46.59提升至56.27。
DeepSeek-V3.2 Pretrain训练样例基于torchtitan,在64卡Atlas A3集群上完成DeepSeek-V3.2模型32K长序列预训练复现。
DeepSeek-V4-Flash 续训练样例基于torchtitan + autufuse,使能极简切分和训练入图,在Atlas A3 64卡集群支持DeepSeek-V4-Flash-285B模型的续训练,吞吐达成1100tokens/p/s
DeepSeek-V3 MXFP8/HiF8 低精度预训练样例基于MindSpeed,在 8 卡 Atlas A5 环境上完成 DeepSeek-V3 裁剪模型8k序列预训练复现。

🏃 一站式平台快速体验

「一站式平台」是为开发者提供的 NPU 环境,内部已集成完整的 CANN 环境,可以直接使用。

cann-recipes-train 针对该平台在相应样例 README 中提供了简化的「快速启动」路径,帮助用户最小步骤完成 NPU 模型训练体验。当前支持的模型正在持续扩展中,敬请关注:

实践简介
Qwen3-1.7B SFT训练样例在一站式平台Atlas A2/A3环境中完成Qwen3-1.7B 单卡SFT训练。

💡 特性介绍

本项目在探索最佳实践的过程中引入了如下特性:

特性介绍
SAM无损投机推理docs/features/sam_speculative_decoding.md
RL On-Policy 推理场景的序列级均衡调度引擎docs/features/rollout_rebalance.md

📖 目录结构说明

├── docs # 优化技术介绍文档 ├── llm_rl # llm强化学习训练相关代码 │ ├── deepseek # deepseek强化学习训练相关代码 │ ├── qwen2_5 # Qwen2.5强化学习训练相关代码 │ ├── qwen3 # Qwen3强化学习训练相关代码 │ └── ... ├── agent_rl # agent强化学习训练相关代码 │ ├── qwen3_tool_agent # Qwen3 tool agent RL训练 │ ├── qwen2_code_rl # 基于ScaleBox沙盒的Code RL训练 │ └── ... ├── multimodal_rl # 多模态强化学习训练相关代码 ├── llm_sft # llm有监督微调训练相关代码 ├── llm_pretrain # llm预训练相关代码 ├── CONTRIBUTION.md ├── README.md └── ...

🤖 智能代码助手

本仓已集成 Zread 代码仓库智能体,旨在通过 AI 技术为您提供更深度的代码理解与技术支持。

点击徽章,进入其专属页面,开启在线智能代码学习与知识问答体验!

⚠️ 说明: 当前代码仓库智能体服务处于试点阶段。在使用过程中,如果您发现 AI 生成的内容存在准确性问题,或对智能助手的功能有任何改进建议,欢迎通过 Issues 与我们交流,您的反馈对我们非常重要!

📝 相关信息

  • 贡献指南

  • 许可证

    cann-recipes-train仓涉及的模型,如模型目录下存在License的,以该License为准。如模型目录下不存在License的,遵循Apache 2.0许可证,对应许可证文本可查阅LICENSE

  • 免责声明

【免费下载链接】cann-recipes-train本项目针对LLM与多模态模型训练业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-train

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 4:52:39

2026技术大会/社区/博主推荐:拒绝信息差

在2026年的今天,软件测试行业正经历一场前所未有的范式转移。当Claude Mythos模型在测试中意外挖出潜伏了27年的重大软件漏洞时,整个行业都意识到:代码质量早已不是锦上添花,而是悬在数字世界头顶的达摩克利斯之剑。Agentic AI与自…

作者头像 李华
网站建设 2026/5/10 4:50:49

条式隔热型材“先复合后表面处理”加工工艺

条式隔热型材“先复合后表面处理”加工工艺 摘要: 本文就“先复合后表面处理”这种隔热型材加工方法的三个关键环节:带热熔胶线的隔热条、隔热型材烘干、烤漆温度和时间控制等进行分析和探讨。 关键词: 先复合后表面处理;热熔胶线;烘干;烤漆温度; 众所周知,穿条式隔…

作者头像 李华
网站建设 2026/5/10 4:49:58

ailia-models:跨平台AI模型推理库与预训练模型仓库实战指南

1. 项目概述:一个为AI应用开发者准备的“百宝箱”如果你正在寻找一个能快速将前沿AI模型集成到你的应用中的工具,或者你厌倦了为每个新项目重复搭建环境、处理模型格式转换的繁琐工作,那么ailia-ai/ailia-models这个项目绝对值得你花时间深入…

作者头像 李华
网站建设 2026/5/10 4:48:42

3步掌握大麦网智能脚本:告别手动抢票的终极自动化工具

3步掌握大麦网智能脚本:告别手动抢票的终极自动化工具 【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本 项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 还在为抢不到演唱会门票而烦恼吗?每次热门演出开…

作者头像 李华
网站建设 2026/5/10 4:48:41

数据智能体分级框架与L2级实战:从概念到工程落地

1. 数据智能体:从概念喧嚣到工程实践的冷静审视 最近几年,如果你关注数据科学和人工智能的交叉领域,一定被“数据智能体”这个词刷过屏。从学术论文到商业发布会,从开源项目到企业级产品,似乎一夜之间,所有…

作者头像 李华
网站建设 2026/5/10 4:47:33

从零构建开源中文语音助手:wukong-robot核心架构与实战指南

1. 项目概述:从零打造你的专属中文智能语音助手如果你和我一样,对市面上的智能音箱总有些“隔靴搔痒”的感觉——要么是唤醒词固定死板,要么是技能生态封闭,想自己加个功能比登天还难,那么今天聊的这个项目&#xff0c…

作者头像 李华