news 2026/5/11 8:19:36

英伟达机器人掌门人Jim Fan年度复盘:Vibe Coding火出圈,机器人领域却依然焦头烂额

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
英伟达机器人掌门人Jim Fan年度复盘:Vibe Coding火出圈,机器人领域却依然焦头烂额

英伟达机器人业务负责人、GEAR实验室联合负责人Jim Fan泼了一盆冷水,jim fan 认为机器人领域还处于混乱状态,就连发展方向都有可能是错的。

AK这两天发了一篇推文,引爆了媒体,因为Vibe Coding真的太厉害了,厉害到连AK都焦虑了,AK认为过去一个月没有跟上节奏的人已经对软件行业的认知out了。

与此同时,2025年的机器人领域发展可能是另一番景象,英伟达机器人业务负责人、GEAR实验室联合负责人Jim Fan泼了一盆冷水,jim fan 认为机器人领域还处于混乱状态,就连发展方向都有可能是错的。

Jim Fan刚刚分享了他对机器人领域现状的焦虑,这是他在2025年学到的3个教训。

1. 硬件虽领先软件,但可靠性严重拖累迭代速度

我们已经见证了精湛的工程艺术,比如Optimus、e-Atlas、Figure、Neo、G1等等。

现状是,身体的能力超过了大脑的指挥能力,我们要用到最好的AI,并没有榨干这些前沿硬件的全部汁水。

然而,照看这些机器人需要整整一个运营团队。

不像人类,机器人没法从瘀伤中自愈。过热、电机损坏、离奇的固件问题每天都在困扰着我们。错误是不可逆的,也是不可原谅的。

Jim Fan感叹:唯一能随着规模增长的,只有我的耐心。

2. Benchmark在机器人领域仍是一场灾难

LLM圈的普通人以为MMLU和SWE-Bench是常识。但在机器人领域?先别急。

在这里,没有人对任何事情达成一致:无论是硬件平台、任务定义、评分标准、模拟器,还是现实世界的设置。

每个人都在针对每个新闻发布临时定义的基准测试上,宣称自己是SOTA(当前最佳)。每个人都从100次重试中,挑樱桃般选出看起来最漂亮的那一次演示。

Jim Fan呼吁:2026年我们必须做得更好,停止将可复现性和科学纪律视为二等公民。

3. 基于VLM的VLA路线「感觉不对」

VLA(视觉-语言-动作)模型一直是机器人大脑的主流方法。配方很简单:拿一个预训练的VLM(视觉语言模型)检查点,在上面嫁接一个动作模块。

但仔细想想,VLM是为“视觉问答”这类Benchmark高度优化的。

这意味着两个问题:

1.VLM中的大多数参数是为语言和知识服务的,而不是为物理学服务的;2.视觉编码器为了高层理解(Q&A),会主动调整以丢弃低级细节。

但微小的细节对灵巧性至关重要。

Jim Fan认为,没有理由相信VLA的性能会随着VLM参数的增加而扩展。预训练是错位的。

相比之下,视觉世界模型(Video World Model)似乎是机器人策略更好的预训练目标。Jim Fan表示正在押注于此。

质疑与回应

针对Jim Fan的观点,网友Stewart Alsop提出了尖锐的质疑:

如果视频世界模型是更好的预训练目标,为什么Helix、GR00T N1和π0这些真正交付结果的模型,依然构建在VLM骨干之上?

世界模型的方法目前大多只用于策略评估和合成数据,而非直接的运动控制。

另外,既然硬件瓶颈限制了迭代速度,这难道不适用于任何预训练路线吗?直到我们解决机器人数据缺口之前。

Jim Fan:

它们是2025年的模型,期待2026年的下一个大模型。

我个人认为2026年还是要看谷歌,DeepMind还在憋大招,8月份时已经展示过Genie 3这个强大的世界模型了,Genie 4有可能真正让机器人拥有在现实世界连续执行任务的大脑。

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 8:44:52

碾压小扎!22岁成亿万富翁,2025年AI造富速度刷新人类认知

2025 年,AI 不仅占据话题 C 位,更成为超级造富机,将 50 多位创始人送入亿万富翁俱乐部。本文将盘点这场史无前例的 AI 财富狂欢与背后的顶级赢家。2025 年,AI 无疑是绝对的话题中心。空谈误国,实干兴邦,而 …

作者头像 李华
网站建设 2026/5/6 21:04:22

SSH密钥登录PyTorch容器:增强安全性与便捷性

SSH密钥登录PyTorch容器:增强安全性与便捷性 在深度学习项目日益复杂、团队协作频繁的今天,如何快速搭建一个既安全又高效的开发环境,成为每个AI工程师必须面对的问题。尤其是在使用GPU资源进行模型训练时,既要保证计算性能的充分…

作者头像 李华
网站建设 2026/5/10 3:44:14

综合布线品牌排名哪家技术强

综合布线品牌排名哪家技术强 在当今数字化时代,综合布线系统作为网络基础设施的重要组成部分,其技术水平直接影响着网络的性能和稳定性。众多综合布线品牌在市场上竞争激烈,究竟哪家技术更强呢?让我们来深入分析。 大唐风暴&…

作者头像 李华
网站建设 2026/5/3 19:29:38

Markdown TOC自动生成PyTorch文档目录

Markdown TOC 自动生成 PyTorch 文档目录 在现代 AI 工程实践中,一个常见的挑战是:如何在快速迭代的模型开发中,同时保证环境的一致性和文档的专业性?我们经常遇到这样的场景——团队成员各自配置本地环境,结果“在我机…

作者头像 李华
网站建设 2026/5/10 0:56:28

PHP开源订水平台源码系统,支持手动派单或自动分配

温馨提示:文末有资源获取方式在本地生活服务全面线上化的今天,送水行业也需借助数字工具提升竞争力。选择一套合适的在线订水系统,是业务升级的第一步。本文将深入解析一款备受推崇的PHP开源订水平台源码,看它如何为您的送水业务注…

作者头像 李华
网站建设 2026/5/2 16:53:05

vue2大文件上传组件的源码解析与扩展开发

要求:免费,开源,技术支持 技术:百度webuploader,分块,切片,断点续传,秒传,MD5验证,纯JS实现,支持第三方软件集成 前端:vue2,vue3,vue-cli,html5,webuploader …

作者头像 李华