news 2026/5/1 10:30:57

IROS‘25冠军 | X-VLA重磅开源,全面刷新机器人基准性能记录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
IROS‘25冠军 | X-VLA重磅开源,全面刷新机器人基准性能记录

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮,为大家着重分享相关领域的核心内容。如果您有相关内容需要分享,欢迎文末联系我们。

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model
论文:https://arxiv.org/pdf/2510.10274
主页:https://thu-air-dream.github.io/X-VLA/
Code:https://github.com/2toinf/X-VLA
Model:https://huggingface.co/collections/2toINF/x-vla
Data:https://huggingface.co/datasets/Facebear/XVLA-Soft-Fold

直播信息

时间

2025年12月16日(周二)19:00

主题

X-VLA重磅开源,全面刷新机器人基准性能记录

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播

主讲嘉宾

郑金亮
清华大学智能产业研究院(AIR)博士三年级

清华大学智能产业研究院(AIR)博士三年级。研究方向为计算机视觉与具身智能。以第一,共一作者发表ICML, NeurIPS, CVPR等多篇顶会论文,曾获ICML 2024 MFM- EAI workshop杰出论文奖,IROS2025 AGI World challenge冠军。担任NeurIPS, CVPR, ICLR, ICML等学术期刊及会议审稿人。

直播大纲

X-VLA是一种高扩展、简洁的通用视觉-语言-动作(VLA)模型,它通过为每个机器人平台引入实体特定的可学习软提示(Soft Prompts)来有效解决跨实体、异构机器人数据的学习难题。X-VLA是首个实现120min无辅助自主叠衣任务的全开源模型(公开数据、代码与参数),以仅0.9B的参数量在五大权威仿真基准上全面刷新性能纪录,同时,基于X-VLA的解决方案在IROS-AGIBOT World Challenge上大放异彩,夺得冠军。总体而言,X-VLA为具身智能领域提供了一个性能强劲、完全开源的新基线与技术范式。

  1. 背景介绍

  2. X-VLA结构设计

  3. 预训练方法

  4. 后训练方法

  5. 未来展望

参与方式

:3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮,为大家着重分享相关领域的核心内容。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:07:38

vue基于springboot的京东绿谷旅游景点交通酒店预订网的设计与实现

目录已开发项目效果实现截图开发技术介绍系统开发工具:核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式&…

作者头像 李华
网站建设 2026/5/1 8:43:36

企业采购决策参考:EmotiVoice vs 商业TTS成本效益分析

企业采购决策参考:EmotiVoice vs 商业TTS成本效益分析 在智能语音内容需求爆发的今天,越来越多企业面临一个现实问题:如何在保障语音质量的同时,控制日益增长的文本转语音(TTS)服务成本?尤其是当…

作者头像 李华
网站建设 2026/4/30 10:11:44

为什么人工智能的实施并非“一切照旧”?

人工智能在企业中的落地应用,堪称企业运营模式的一次颠覆性转变。人工智能融入职场,绝非简单引入一项新技术那么浅显。它意味着企业的运营模式、工作流程、治理体系乃至决策机制,都将迎来深层次的变革。与传统工具或系统不同,人工…

作者头像 李华
网站建设 2026/3/29 9:53:53

【Java毕设源码分享】基于springboot+vue的敦煌文化旅游管理系统的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/30 15:15:33

【Java毕设源码分享】基于springboot+vue的中医知识学习服务管理系统设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华