安装好Isaac Sim 和Isaac Lab后,其中使用Isaac Lab的最快方法是使用Batteries-included中包含的机器人任务,比如机器人和无人机任务。
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/train.py --task=Isaac-Velocity-Rough-Anymal-C-v0 --headless1.找到 checkpoint
训练完成后,model.pt会每50次存在/home/ai_teaching/isaacsim/IsaacLab/logs/rsl_rl/anymal_c_rough/日期,这个文件夹下。有了这些.pt权重文件,不等于真实机械狗立刻就会自己运动;它首先表示“你已经训练出了一个控制策略”,接下来要把这个策略拿去“播放、推理、部署”。Isaac Lab 官方文档明确说,训练完成后通常先用play scripts可视化策略效果;如果要上真机,还要走专门的policy deployment流程。
如果这个 checkpoint 训练得成功,那么在对应任务环境里,策略会根据观测自动输出动作,让仿真里的机械狗自己走。官方的 “Policy Inference in USD Environment” 教程就是在讲:把一个已经训练好的策略拿来做policy inference,让机器人在场景中运动。
2.用 play 脚本加载它
要使用model_1499.pt,
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py \ --task=Isaac-Velocity-Rough-Anymal-C-Play-v0 \ --checkpoint=/home/ai_teaching/isaacsim/IsaacLab/logs/rsl_rl/anymal_c_rough/replace_with_your_path/model_1499.pt3.看仿真里的效果
如果训练成功,你会看到仿真中的 ANYmal:
- 自动保持平衡
- 按任务要求前进
- 在 rough terrain 上行走更稳
.pt本质上只是神经网络参数,它本身不会独立运动。
它必须和这些东西一起工作:
- 对应的机器人模型
- 对应的任务环境
- 对应的观测定义
- 对应的动作空间
- 对应的控制频率和配置文件
同理,Isaac Lab也包含了无人机中的场景
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/train.py --task=Isaac-Quadcopter-Direct-v0play一下:
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task=Isaac-Quadcopter-Direct-v0Isaac Lab官方文档:Local Installation — Isaac Lab Documentation