news 2026/5/26 15:39:57

AI动态简报之算力基建篇(2026.05.26)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI动态简报之算力基建篇(2026.05.26)


⚡ 第1条:英伟达B100芯片发布,大模型训练性能飙升5倍

核心信息

英伟达CEO黄仁勋于2026年5月23日在台北国际电脑展上正式发布新一代AI GPU B100,基于"Blackwell Next"全新架构。在大模型训练任务上,性能较前代旗舰H200提升高达5倍,从A100到H200的历代性能提升幅度仅1.5-2倍,此次属于跨越式进步。

性能/价格对比

  • B100 vs H200:训练性能提升5倍
  • 过去需一个月训练的大模型,未来可能只需不到一周
  • 预计2026年Q4开始出货,定价尚未公布

对开发者/企业的影响

研发效率将爆炸式增长,总拥有成本(TCO)显著下降,AI创新门槛进一步降低。但出货需等到Q4,短期内算力荒仍将持续。

信息来源:IT之家 / raybyte.cn | 2026-05-24


⚡ 第2条:硅谷深陷算力荒,H200一夜涨价30%创代际价格倒挂奇观

核心信息

2026年5月,硅谷AI算力"饥荒"达到前所未有的高度。H200 GPU现货价格一夜涨价约30%,从4.96美元/GPU小时涨至6.40美元/GPU小时,甚至出现旧卡比新卡贵的代际价格倒挂现象(H200现价高于新一代B200的5.68美元)。

性能/价格对比

指标

数据

H200一夜涨幅

~30%

H200现价

6.40美元/GPU小时

H100半年租金涨幅

近40%(1.70→2.35美元/小时)

H100现货价格

4美元+/小时(两年前两倍)

云平台H100排队

已排至2027年Q1

对开发者/企业的影响

算力正从基础设施变成筛选机制。普通开发者连"启动一台8×H100服务器"都难以实现,预算不足的小型团队和创业公司被直接挡在AI训练门外。

信息来源:36氪 | 2026-05-20


⚡ 第3条:DeepSeek-V4-Pro API宣布永久2.5折,输入价格降至0.025元/百万Token

核心信息

DeepSeek官方于2026年5月23日宣布,DeepSeek-V4-Pro模型的2.5折优惠活动将永久生效,而非此前公布的"6月起恢复原价"。这是继2025年初DeepSeek引发行业价格战后的又一次重磅降价。

性能/价格对比

计费项

原价(元/百万Token)

永久折扣价

输入(缓存命中)

0.1

0.025

输入(缓存未命中)

12

3.0

输出

24

6.0

对开发者/企业的影响

DeepSeek-V4-Pro的永久降价进一步压低了AI应用的成本门槛,输入命中缓存价格已低至"离谱"水平,将加速AI应用在中小企业和个人开发者中的普及。

信息来源:IT之家 / 今日头条 | 2026-05-23


⚡ 第4条:全球AI大模型周调用量五连涨,中国调用量增速19.89%领跑

核心信息

据OpenRouter最新数据,2026年5月18日至24日当周,全球AI大模型总调用量达28.9万亿Token,环比增长7.4%,连续五周上涨。其中中国AI大模型周调用量达9.223万亿Token,环比增长19.89%,领跑全球。

性能/价格对比

区域

周调用量

环比增长

中国

9.223万亿Token

+19.89%

美国

4.93万亿Token

+16.27%

全球

28.9万亿Token

+7.4%

对开发者/企业的影响

中国AI大模型调用量已达美国的1.87倍,且增速更快,说明国内AI应用落地速度和规模均处于全球领先地位。对AI应用开发者而言,国内市场需求持续旺盛,赛道红利仍在释放。

信息来源:每日经济新闻 / 东方财富网 | 2026-05-26


⚡ 第5条:Kimi K2系列API于5月25日下线,月之暗面推动用户迁移至K2.6

核心信息

月之暗面Kimi官方宣布,kimi-k2系列模型API将于2026年5月25日正式下线,不再维护和支持。受影响模型包括kimi-k2-0711-preview、kimi-k2-0905-preview、kimi-k2-turbo-preview、kimi-k2-thinking等5个版本。官方建议用户直接迁移至最新模型kimi-k2.6

性能/价格对比

  • kimi-k2.6 相比 K2 系列,多模态理解、思考能力、代码能力和Agent能力均有提升
  • API下线时间:2026-05-25(已生效)
  • 替代模型:kimi-k2.6(持续支持)

对开发者/企业的影响

正在使用Kimi K2系列API的开发者需尽快完成模型迁移,否则2026年5月25日后相关API调用将失效。建议同步评估kimi-k2.6的能力是否满足业务需求。

信息来源:腾讯新闻 / 月之暗面官方 | 2026-05-26


📌 本简报由 英辰朗迪GEO整理

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 15:39:28

2026年Q2机械键盘选购全指南,男生耐用款式与桌面搭配推荐洛斐

如今机械键盘市场细分程度不断提升,无线化、矮轴化成为主流发展趋势,大众选购键盘不再只看重基础按键功能,手感舒适度、机身耐用度、外观适配性以及多场景兼容能力,都成为考量重点。不少男性用户挑选时,偏爱质感扎实、…

作者头像 李华
网站建设 2026/5/26 15:39:10

3分钟快速掌握:Win11Debloat的7个关键优化步骤

3分钟快速掌握:Win11Debloat的7个关键优化步骤 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and customize…

作者头像 李华
网站建设 2026/5/26 15:31:26

UniGym框架:基于统一Transformer与对抗去偏的体操动作质量评估系统

1. 项目概述:从主观评分到客观分析的体操评估革命 在竞技体操的训练馆里,你经常能看到这样的场景:教练紧盯着运动员的每一次腾空、转体、落地,凭借多年的经验和直觉,在脑海中快速形成一个分数——“起跳角度低了5度”、…

作者头像 李华
网站建设 2026/5/26 15:30:33

URP下RenderTexture实现逻辑分屏的实战方案

1. 这不是“分屏”而是“逻辑分屏”:URP下RenderTexture的真正价值被严重低估了很多人一看到“分屏联机对战”,第一反应是Unity老版本里那种粗暴的Camera.rect裁剪多相机渲染——画面被物理切开,左右各占0.5宽度,然后两个玩家在同…

作者头像 李华
网站建设 2026/5/26 15:29:49

自动驾驶多目标跟踪:卡尔曼滤波与GNN的CUDA并行化实战

1. 项目概述:当自动驾驶遇上高性能计算在自动驾驶的感知世界里,多目标跟踪(MOT)扮演着“记忆中枢”的角色。它不仅要回答“现在有什么”,更要预测“接下来会怎样”。想象一下,一辆在城市街道上行驶的自动驾…

作者头像 李华
网站建设 2026/5/26 15:25:56

Unity AssetBundle底层原理与热更避坑指南

1. 为什么你改了AssetBundle名字,游戏却还在用旧资源?我第一次在项目里改AssetBundle名字时,打包完发现UI纹理还是旧的——明明新图已经放进文件夹、Bundle名也改了、连哈希值都刷新了,可运行时加载出来的还是上个月美术给的初稿。…

作者头像 李华