news 2026/6/15 12:34:14

Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

Amazon EC2 G7e实例现已正式可用,为生成式AI推理和图形工作负载提供高性价比与卓越性能。

Amazon EC2 G7e实例搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU,适用于空间计算、科学计算等多种GPU加速型工作负载。相较于Amazon EC2 G6e实例,Amazon EC2 G7e实例的推理性能最高可提升2.3倍。

与前代实例相比,Amazon EC2 G7e实例的核心升级如下:

NVIDIA RTX PRO 6000 Blackwell GPU:相比Amazon EC2 G6e,Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存,用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。

NVIDIA GPUDirect P2P:对于单块GPU内存无法承载的模型,用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术,通过PCIe互连实现GPU间的直接通信,从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外,与G6e实例搭载的L40s GPU相比,G7e实例的GPU间带宽最高可提升4倍,大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务,并且这些GPU提供的GPU内存总容量可高达768GB。

网络性能:Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍,可满足小规模多节点工作负载的运行需求。同时,多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问(RDMA),有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage,与Amazon EC2 G6e实例相比,实例吞吐量最高可提升至1.2Tbps,助力用户更快加载模型。

Amazon EC2 G7e规格参数

Amazon EC2 G7e实例最高可配置8块NVIDIA RTX PRO 6000 Blackwell服务器版GPU,GPU内存总量最高可达768GB(单块GPU配备96GB内存),并搭载Intel Emerald Rapids处理器,支持最高192个vCPU、1600Gbps网络带宽、2048GiB系统内存以及15.2TB本地NVMe SSD存储。

Amazon EC2 G7e实例具体规格参数如下:

您可借助Amazon Deep Learning AMIs(DLAMI)运行机器学习工作负载,启动Amazon EC2 G7e实例,并通过亚马逊云科技管理控制台、Amazon CLI及SDK进行操作,搭配Amazon ECS、Amazon EKS可获得托管式体验。该实例对Amazon SageMaker AI的支持功能即将上线。

现已可用

Amazon EC2 G7e实例现已在美国东部(北弗吉尼亚州)与美国东部(俄亥俄州)的亚马逊云科技区域可用。如需了解该实例区域部署情况及未来规划,请参阅亚马逊云科技区域功能页面的Amazon CloudFormation资源标签页中搜索。

Amazon EC2 G7e实例支持On-Demand Instances、Savings Plan及Spot Instances三种方式购买,以及Dedicated Instances与Dedicated Hosts两种部署模式。定价详情参阅Amazon EC2定价页面。

即刻前往Amazon EC2控制台上手体验!更多信息请参阅Amazon EC2 G7e实例页面

亚马逊云科技区域功能页面:

https://builder.aws.com/build/capabilities/explore?tab=cfn-resources&trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

Amazon EC2定价页面:

https://aws.amazon.com/ec2/pricing

Amazon EC2 G7e实例页面:

https://aws.amazon.com/ec2/instance-types/g7e/?trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

本篇作者

Channy

亚马逊云科技新闻博客首席博主、首席开发者布道师。

新用户注册海外区域账户,可获得最高200美元服务抵扣金,覆盖Amazon Bedrock生成式AI相关服务。“免费计划”账户类型,确保零花费,安心试用。

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

点击阅读原文查看博客!获得更详细内容!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/12 17:44:57

从零开始:5步快速搭建本地AI视频生成平台

从零开始:5步快速搭建本地AI视频生成平台 【免费下载链接】HeyGem.ai 项目地址: https://gitcode.com/GitHub_Trending/he/HeyGem.ai 想要在本地环境中创建专业的AI驱动视频内容,而无需依赖云端服务?HeyGem.ai作为一款开源视频生成工…

作者头像 李华
网站建设 2026/5/29 0:29:12

终极指南:如何彻底解决DeepEP分布式训练中的首调延迟问题

终极指南:如何彻底解决DeepEP分布式训练中的首调延迟问题 【免费下载链接】DeepEP DeepEP: an efficient expert-parallel communication library 项目地址: https://gitcode.com/GitHub_Trending/de/DeepEP 还在为DeepEP分布式训练启动时的性能骤降而烦恼吗…

作者头像 李华
网站建设 2026/6/6 10:08:35

My-Dream-Moments 完整安装指南:打造智能情感陪伴助手

My-Dream-Moments 完整安装指南:打造智能情感陪伴助手 【免费下载链接】My-Dream-Moments 推荐使用DeepSeekV3。可以接入微信、QQBot。基于LLM的更逼真的情感陪伴程序。内置了 Atri-My dear moments 的 prompt。Built-in prompt for Atri My dear moments.Support W…

作者头像 李华
网站建设 2026/6/15 12:14:46

ElevenClock完全指南:解锁Windows 11时钟的无限可能

ElevenClock完全指南:解锁Windows 11时钟的无限可能 【免费下载链接】ElevenClock ElevenClock: Customize Windows 11 taskbar clock 项目地址: https://gitcode.com/gh_mirrors/el/ElevenClock 还在为Windows 11任务栏时钟的单调功能而苦恼吗?E…

作者头像 李华
网站建设 2026/6/15 12:14:16

语音转换新纪元:3步掌握AI变声核心技术

语音转换新纪元:3步掌握AI变声核心技术 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI 语音数据小于等于10分钟也可以用来训练一个优秀的变声模型! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrieval-based-Voice-Conversion-We…

作者头像 李华
网站建设 2026/6/15 12:17:18

Qwen-Image-Layered使用技巧:如何获得更干净的图层?

Qwen-Image-Layered使用技巧:如何获得更干净的图层? 1. 引言:为什么图层质量对图像编辑如此关键? 你有没有遇到过这样的情况:想把一张照片里的某个物体单独调整颜色,结果一动就带花了背景?或者…

作者头像 李华