news 2026/6/15 21:50:37

Learning by Watching: Physical Imitation ofManipulation Skills from Human Videos论文学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Learning by Watching: Physical Imitation ofManipulation Skills from Human Videos论文学习

这篇论文主要的工作也是要研究如何用人类演示视频来训练机器人。先通过 MUNIT 模型(无监督图像翻译)把人类演示视频逐帧转化为机器人视角的视频 —— 翻译后的视频可能有视觉伪影,缺少结构化关键信息,无法直接用于训练;接着用 Transporter 模型从翻译后的机器人视频中提取关键点轨迹(比如机器人末端、物体中心的运动轨迹);最后用这些轨迹作为强化学习的训练目标,让机械臂的关键点轨迹与目标轨迹尽可能一致,从而学会操作技能。

那么Transpoprter模型是怎么弄出来的呢?为什么我们可以以一个无监督的方式训练出来一个Transporter模型?具体流程是这样:

  1. 取机器人视频的相邻两帧 x1(前一帧)和 x2(当前帧),先用视觉特征提取器 Φ 提取两帧的特征图 Φ(x1)、Φ(x2);再用关键点检测器 Ψ 生成两帧的关键点坐标,并基于坐标生成高斯热图 HΨ(x1)、HΨ(x2)—— 这两个热图用来标记两帧中 “模型认为的关键区域”(一开始 Ψ 不够精准,需要通过训练优化)。
  2. 基于热图做特征迁移:以 x1 的特征图 Φ(x1) 为基础,保留其非关键区域的特征,同时把关键区域的特征替换成 x2 的关键区域特征,得到迁移后的特征图Φ^(x1,x2);再用重建网络 R 把这个特征图还原成图像x2^,并和真实的 x2 对比。
  3. 若 Ψ 提取的关键点是准确的,还原后的x2^会和真实 x2 高度相似,二者的差异(重建损失Ltransporter​)就小;若关键点提取错误,差异会变大 —— 模型通过这个损失反向优化 Ψ,直到能精准提取机器人视频中的关键区域。

经过上述训练,我们就得到了能准确提取关键信息的 Transporter 模型,其核心组件 Ψ 就是我们用来提取关键点轨迹的工具。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:40:44

hot100-53搜索旋转排序数组

一、题目nums升序排列,值互不相同,经过k次旋转,找出target的下标,如果没有返回-1。二、思路每次比较 nums[mid] 与 nums[left] 和 nums[right],判断 mid 在哪一段,再决定如何缩小范围。1. 如果 nums[left] …

作者头像 李华
网站建设 2026/6/15 14:30:38

花艺资源合集

插花系列课程 文件大小: 2.9GB内容特色: 系统示范花材搭配、造型与配色技巧适用人群: 零基础花艺爱好者、手作博主、花店主理人核心价值: 学完即可独立完成商用与居家插花作品下载链接: https://pan.quark.cn/s/65c817498624 插花艺术教程|家居装饰 婚礼花艺&…

作者头像 李华
网站建设 2026/6/15 14:43:06

嵌入式知识篇---直流电路与交流电路

第一部分:直流电路 —— 稳定单项流动的“河流”想象一条平静、宽阔的河流,比如长江。 水永远从西边(高处)稳定地流向东边(低处),方向不变,速度也基本不变。1. 核心特征:…

作者头像 李华
网站建设 2026/6/15 19:46:31

论文降AI全攻略:从检测到修改,十大工具帮你一站式搞定

家人们,现在学校查得是真严,不仅重复率,还得降ai率,学校规定必须得20%以下... 折腾了半个月,终于把市面上各类方法试了个遍,坑踩了不少,智商税也交了。今天这就把这份十大降AI工具合集掏心窝子…

作者头像 李华
网站建设 2026/6/15 19:21:53

纯干货无广:基于真实体验的十大好用降AI工具红黑榜

家人们,现在学校查得是真严,不仅重复率,还得降ai率,学校规定必须得20%以下... 折腾了半个月,终于把市面上各类方法试了个遍,坑踩了不少,智商税也交了。今天这就把这份十大降AI工具合集掏心窝子…

作者头像 李华
网站建设 2026/6/15 11:21:30

深度解析十大主流降AI软件:谁才是又快又好用的?

家人们,现在学校查得是真严,不仅重复率,还得降ai率,学校规定必须得20%以下... 折腾了半个月,终于把市面上各类方法试了个遍,坑踩了不少,智商税也交了。今天这就把这份十大降AI工具合集掏心窝子…

作者头像 李华