news 2026/6/2 9:55:46

英伟达推出Cosmos 3:开放全能模型,将物理AI训练评估周期从数月缩至数天

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
英伟达推出Cosmos 3:开放全能模型,将物理AI训练评估周期从数月缩至数天

【导语:英伟达正式推出基于突破性Transformer混合架构的物理AI开放世界基础模型Cosmos 3,将视觉推理等功能结合,还缩短了训练和评估周期。同时推出NVIDIA Cosmos联盟,推动下一代世界模型发展。】


全能开放模型:Cosmos 3革新物理AI

Cosmos 3是世界上第一个完全开放的全能模型,能以领先的物理精度原生理解和生成文本、图像、视频、环境声音和动作。它将物理AI的训练和评估周期从数月缩短到数天,为开发者在构建机器人、自动驾驶汽车和视觉AI方面带来代际飞跃。

创新架构:解决物理AI根本挑战

Cosmos 3采用mixture - of - transformers架构,将reasoning transformer与expert generation transformer相结合。该架构使模型能够在生成视频和动作轨迹之前理解对象交互、运动和时空关系,解决了物理AI中让机器人、自动驾驶汽车等在训练数据有限和仿真堆栈分散情况下在现实世界泛化的根本挑战。

它基于最大的多模态物理AI数据集之一进行训练,包含数十亿个涵盖文本、图像、视频、声音和动作轨迹的样本。

卓越性能:多测试排名领先

基准测试结果显示,在开源模型中,Cosmos 3在世界生成准确率方面,于Artificial Analysis、Physics - IQ、PAI - Bench和R - Bench测试中均排名第一;在动作策略方面,在RoboLab和RoboArena测试中排名第一;在视觉理解方面,在VANTAGE - Bench和TAR排行榜上名列前茅。

丰富产品线:满足不同开发需求

Cosmos 3产品线为开发者提供了适用于物理AI开发不同阶段的选择。Cosmos 3 Super适用于需要最高物理精度和生成质量的训练后机器人和AV模型;Cosmos 3 Nano可在极短时间内实现高质量视频和动作推理;Cosmos 3 Edge即将推出,用于在边缘进行实时推理。

编辑观点:Cosmos 3的推出为物理AI领域带来重大突破,其开放特性和卓越性能有望推动相关产业快速发展,联盟的成立也将加速下一代世界模型的进步。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/2 9:51:00

微软女性研究员计划:系统性赋能计算领域女性技术人才

1. 项目概述:一次聚焦女性技术人才的系统性赋能“Microsoft fellowship program supports women in computing”,这个标题直指一个在科技行业持续引发讨论的核心议题:如何系统性、有效地支持女性在计算科学领域的发展。这不是一个简单的奖学金…

作者头像 李华
网站建设 2026/6/2 9:48:58

size-plugin与Rollup对比:如何选择适合你的资产大小追踪工具

size-plugin与Rollup对比:如何选择适合你的资产大小追踪工具 【免费下载链接】size-plugin Track compressed Webpack asset sizes over time. 项目地址: https://gitcode.com/gh_mirrors/si/size-plugin 在现代前端开发中,有效监控和管理资产文件…

作者头像 李华