news 2026/5/29 21:49:06

全球第一!智元斩获WorldArena世界模型总分冠军

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
全球第一!智元斩获WorldArena世界模型总分冠军

近日,具身领域热门榜单 WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果揭晓。智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称GE 2.0)凭借优异的综合表现,登顶榜单榜首。

Project page:https://ge-sim-v2.github.io/

Arxiv:https://arxiv.org/abs/2605.27491

Github:https://github.com/AgibotTech/GE-Sim-V2

“世界模型感知与动作响应”赛道聚焦具身智能最本质的“认知与行动”能力,是评判通用人形机器人智能化水平的核心标尺。在该赛道评测中,智元团队使用了原生的世界模型GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。“轻装上阵”依然拔得头筹,充分印证了GE 2.0强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮,智元始终保持自己的节奏,从长远第一性原理出发 ,专注于打磨具身世界模型的坚实技术底座。此次登顶,是智元坚持长期技术演进的实力见证。

在GE 2.0技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0不仅在单点性能上实现了跃升,更真正演进为一个全功能、高可用的世界模拟器,可构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,真正实现从“感知预测”到“仿真进化、自主决策”的闭环升级。

功能矩阵全面补齐:GE 2.0在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。

长时序推演能力突破:在长时序推理任务中,GE 2.0表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时,其生成质量依然超越了基线模型前 10 秒内的表现。

高可靠的闭环评测:作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明GE 2.0在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的“成功率一致”,团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,强有力地证明了GE 2.0作为策略评测器的可靠性。

打通数据回流反哺机制:在奖励模型(Reward Model)的加持下,GE 2.0能够对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。

2026年是具身智能“部署态”元年,机器人从实验室走向真实场景,规模化部署,真正发挥具身智能生产力,这也对算法提出了更高的要求。专注底层技术攻坚与产业价值落地,是智元一贯的技术理念。不论是WorldArena榜单上的优异表现还是技术报告中的性能论证,都彰显了Genie Envisioner技术路线的潜力。未来,智元将持续迭代世界模拟器技术体系,打通具身智能技术闭环,推动世界模型真正走进真实场景,为人形机器人规模化落地筑牢核心技术底座。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/29 21:46:37

Win7 64位下,让WinCC 7.0 SP3与PC Access SP6稳定通讯的保姆级避坑指南

Win7 64位系统下WinCC 7.0 SP3与PC Access SP6通讯全流程实战指南在工业自动化领域,老旧系统的升级改造往往比全新部署更具挑战性。当第十代CPU的现代硬件遇上仅支持Win7系统的PC Access SP6软件,这种跨越时代的兼容性问题让不少工程师头疼不已。本文将带…

作者头像 李华
网站建设 2026/5/29 21:43:59

看完《阿嬷的情书》哭红眼的晚上,我突然懂了律师这行最大的危机

周末,我被朋友圈刷屏的《阿嬷的情书》“逼”进了电影院。说实话,一开始是抗拒的。潮汕方言、没有大明星、讲“下南洋”和“侨批”这种听起来就很年代感的东西——我心想,不就是一部文艺片嘛,能有啥好看的。结果散场的时候&#xf…

作者头像 李华
网站建设 2026/5/29 21:43:59

彻底告别“复制粘贴”:用 API 接口把企微外部群变成自动化流水线

在私域社群运营中,最消耗精力的往往不是高层策略,而是那些琐碎的体力活:早上要在几十个客户群发行业早报、下午要同步活动海报、还要时刻盯着有没有新客户申请进群。 由于常规开发通道对外部群的深度控制有所限制,不少技术团队选…

作者头像 李华
网站建设 2026/5/29 21:40:01

一线观察:赣州家装设计公司长期使用体验的真实细节

嘿,我深耕家装设计垂类都5年啦,也算是有点经验的人。在赣州这片土地上,家装设计行业那是相当热闹,但其中也藏着不少门道。先跟你唠唠赣州家装设计行业的一些痛点。就说低价套路这事儿吧,好多公司打着低价的幌子吸引客户…

作者头像 李华
网站建设 2026/5/29 21:38:02

终极Windows风扇控制指南:用FanControl实现精准温控与极致静音

终极Windows风扇控制指南:用FanControl实现精准温控与极致静音 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tre…

作者头像 李华
网站建设 2026/5/29 21:36:15

苏州晟雅泰电子:关于国内存储芯片的三大主要公司及各自主要应用领域

目前,中国存储芯片产业公认的三大核心企业是长江存储、长鑫科技与兆易创新。它们在技术路径和市场定位上形成了清晰的分工,分别主攻 NAND闪存、DRAM内存 和 NOR闪存 三大领域。公司技术/产品领域核心应用领域长江存储 (YMTC)3D NAND 闪存:主要…

作者头像 李华