news 2026/5/27 18:40:00

Atlas 800I A2 vs Atlas 300I Duo:盘古Pro MoE硬件选型终极指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Atlas 800I A2 vs Atlas 300I Duo:盘古Pro MoE硬件选型终极指南

Atlas 800I A2 vs Atlas 300I Duo:盘古Pro MoE硬件选型终极指南

【免费下载链接】Pangu-Pro-MoE项目地址: https://ai.gitcode.com/hf_mirrors/MindSpore-Lab/Pangu-Pro-MoE

盘古Pro MoE是一款高性能的AI模型,为了充分发挥其性能,选择合适的硬件平台至关重要。本文将对比两款主流昇腾硬件——Atlas 800I A2和Atlas 300I Duo,帮助您为盘古Pro MoE模型做出最佳硬件选型决策。

硬件平台基本要求

盘古Pro MoE推理建议使用1台(8卡)Atlas 800I A2(64G)服务器(基于BF16权重)或使用1台(8卡)Atlas 300I Duo服务器(基于BF16权重)。昇思MindSpore提供了盘古Pro MoE推理可用的Docker容器镜像,供开发者快速体验。

软件配置差异

Atlas 300I Duo特殊配置

使用Atlas 300I Duo推理需要将config.json文件中的torch_dtype配置项由bfloat16改为float16。对应的BF16权重将在模型加载时,自动转换为FP16权重。

推理参数调整

在推理参数设置上,两款硬件也有明显区别:

  • gpu_memory_utilization=0.9,Atlas 300I Duo平台需要修改为0.8
  • max_num_seqs=512,Atlas 300I Duo平台需要修改为128
  • max_model_len=32768,Atlas 300I Duo平台需要修改为16384

镜像拉取与容器启动

Atlas 800I A2镜像拉取

若使用Atlas 800I A2进行推理,则需执行以下 Shell 命令,拉取昇思 MindSpore 盘古Pro MoE Atlas 800I A2推理镜像:

Atlas 300I Duo镜像拉取

若使用Atlas 300I Duo进行推理,则需执行以下 Shell 命令,拉取昇思 MindSpore 盘古Pro MoE Atlas 300I Duo推理镜像:

容器启动命令

以Atlas 800I A2推理为例,执行以下命令,创建并启动容器:

若使用Atlas 300I Duo进行推理,则将上述启动命令中的镜像地址swr.cn-central-221.ovaijisuan.com/mindsporelab/pangu_pro_moe_mindspore-infer:800-A2-20250623替换为swr.cn-central-221.ovaijisuan.com/mindsporelab/pangu_pro_moe_mindspore-infer:300I-Duo-20250623

推理服务启动

Atlas 800I A2服务启动

执行以下shell命令启动Atlas 800I A2推理服务:

Atlas 300I Duo服务启动

若使用Atlas 300I Duo进行推理,则需执行以下shell命令启动推理服务:

性能表现对比

在昇腾Atlas 800I A2平台上部署盘古Pro MoE模型(基于W8A8量化权重),可在时延100ms的约束条件下,实现平均每卡1020token/s的增量吞吐性能。配套代码和镜像计划于7月上旬发布,敬请期待。

Atlas 300I Duo虽然在部分参数上有所限制,但凭借其独特的架构设计,在特定场景下也能展现出优异的性能表现,是预算有限情况下的理想选择。

选型建议

  • 追求极致性能和更大模型支持:选择Atlas 800I A2,支持更高的max_num_seqsmax_model_len,适合处理复杂、长文本任务。
  • 预算有限且任务相对简单:选择Atlas 300I Duo,通过适当调整参数,也能满足大部分推理需求。

无论选择哪款硬件,都需要确保按照官方文档正确配置软件环境和参数,以获得最佳性能。建议在正式部署前,根据实际任务特点进行充分测试和评估。

要开始使用盘古Pro MoE模型,请先克隆仓库:git clone https://gitcode.com/hf_mirrors/MindSpore-Lab/Pangu-Pro-MoE,然后根据所选硬件平台,参考README.md中的详细部署指南进行操作。

【免费下载链接】Pangu-Pro-MoE项目地址: https://ai.gitcode.com/hf_mirrors/MindSpore-Lab/Pangu-Pro-MoE

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 18:37:25

免费跨平台视频资源下载器:3分钟快速上手全攻略

免费跨平台视频资源下载器:3分钟快速上手全攻略 【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 想要轻松下载视频…

作者头像 李华
网站建设 2026/5/27 18:34:22

认知无线电中I/Q失衡与信道估计误差对接收机性能的联合影响分析

1. 项目概述:当硬件损伤遇上信道不确定性在无线通信系统的工程实践中,我们常常面临一个两难境地:理论模型总是完美的,但现实硬件和信道环境却充满了各种“不完美”。I/Q失衡,这个射频前端设计中的“老朋友”&#xff0…

作者头像 李华
网站建设 2026/5/27 18:33:22

5分钟快速上手chfsgui:图形化HTTP文件共享服务器终极指南

5分钟快速上手chfsgui:图形化HTTP文件共享服务器终极指南 【免费下载链接】chfsgui This is just a GUI WRAPPER for chfs(cute http file server) 项目地址: https://gitcode.com/gh_mirrors/ch/chfsgui chfsgui是一款基于Cute HTTP File Server的图形化文件…

作者头像 李华
网站建设 2026/5/27 18:32:24

基于流形分析的电网形成变流器P-Q耦合与限幅器稳定性研究

1. 项目概述在新能源电力系统占比日益提升的今天,电网形成变流器(Grid-Forming Converter, GFM)作为支撑系统频率与电压稳定的核心设备,其动态性能至关重要。与传统的跟网型变流器不同,GFM通过模拟同步发电机的物理特性…

作者头像 李华
网站建设 2026/5/27 18:32:02

如何在Windows上免费实现AirPlay 2投屏:完整指南与实用教程

如何在Windows上免费实现AirPlay 2投屏:完整指南与实用教程 【免费下载链接】airplay2-win Airplay2 for windows 项目地址: https://gitcode.com/gh_mirrors/ai/airplay2-win 你是否曾因为Windows电脑无法接收iPhone或iPad的投屏而感到困扰?Airp…

作者头像 李华
网站建设 2026/5/27 18:31:51

i茅台自动预约系统:告别手动抢购的Java神器

i茅台自动预约系统:告别手动抢购的Java神器 【免费下载链接】campus-imaotai i茅台app自动预约,每日自动预约,支持docker一键部署(本项目不提供成品,使用的是已淘汰的算法) 项目地址: https://gitcode.co…

作者头像 李华