Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation

强化学习突破级有讲解视频

发表时间: 2026-01-06
arXiv: 2601.02778

收录解读

多指灵巧手的 sim-to-real 一直比常规操作任务更难，因为接触丰富、执行器不理想，而且真实系统通常缺少高质量力觉和扭矩观测。很多方法能在模拟器里学到动作，但无法真正做到零样本落到硬件上。

这篇工作的关键在于把几件真正决定 transfer 的系统组件补全：高频虚拟触觉模拟、无需额外扭矩传感器的 current-to-torque calibration，以及对 backlash、torque-speed saturation 等执行器非理想性的随机化建模。作者据此用 asymmetric actor-critic PPO 在纯模拟中训练，并零样本部署到五指手上完成 force tracking 和 in-hand reorientation。

它值得正式收录，因为这不是单一任务技巧，而是一套可复用的 dexterous sim-to-real system recipe。对 tactile-rich manipulation、感知-执行器联合建模和现实差距闭合，这样的组合式方法有明显系统外溢。

它暂时不升到更高一级，原因在于当前验证仍集中在特定硬件和两类关键技能上。虽然方法很强，但是否能成为更广泛 dexterous manipulation 的标准迁移接口，还需要更多平台和任务上的后续证明。

解读视频

B 站 YouTube

链接

论文链接