强化学习
突破级
有讲解视频
收录解读
多指灵巧手的 sim-to-real 一直比常规操作任务更难,因为接触丰富、执行器不理想,而且真实系统通常缺少高质量力觉和扭矩观测。很多方法能在模拟器里学到动作,但无法真正做到零样本落到硬件上。
这篇工作的关键在于把几件真正决定 transfer 的系统组件补全:高频虚拟触觉模拟、无需额外扭矩传感器的 current-to-torque calibration,以及对 backlash、torque-speed saturation 等执行器非理想性的随机化建模。作者据此用 asymmetric actor-critic PPO 在纯模拟中训练,并零样本部署到五指手上完成 force tracking 和 in-hand reorientation。
它值得正式收录,因为这不是单一任务技巧,而是一套可复用的 dexterous sim-to-real system recipe。对 tactile-rich manipulation、感知-执行器联合建模和现实差距闭合,这样的组合式方法有明显系统外溢。
它暂时不升到更高一级,原因在于当前验证仍集中在特定硬件和两类关键技能上。虽然方法很强,但是否能成为更广泛 dexterous manipulation 的标准迁移接口,还需要更多平台和任务上的后续证明。