强化学习
突破级
暂无讲解视频
收录解读
通用双臂机器人操作一直受制于数据成本:双臂动作空间更高、采集更贵、泛化更难,而这与单臂策略近年依靠更大模型和更大数据实现快速扩展形成了鲜明对比。如果双臂系统每次都要从头收集和训练,就很难跟上机器人基础模型的扩张速度。
AnyBimanual 的核心思路是把预训练单臂 policy 直接当作双臂策略的知识底座,再用少量双臂示范完成桥接。具体上,它用 skill manager 调度单臂模型中已经学到的技能表示,再用 visual aligner 去缓解单臂与双臂观测分布差异,从而实现 plug-and-play 式迁移,而不是重新训练一个完全新的双臂大模型。
它值得正式收录,因为它提出了一个很清楚的扩展路径:先在更便宜、更易扩张的单臂数据上积累通用操作知识,再把这些能力迁移到双臂操作。这对机器人数据扩展、技能复用和通用 manipulation policy 的训练工作流都有明显外溢价值。
它暂时不升到更高一级,原因在于当前仍主要证明了单臂到双臂这一条迁移链的有效性。虽然方向很强,也非常实用,但是否会成为更广义多臂/多体系统的标准桥接接口,还要看后续跨平台验证和社区采用。