强化学习 突破级 暂无讲解视频
发表时间
2026-04-01
arXiv
2604.00416

收录解读

humanoid navigation 通常依赖大量机器人自身数据、任务特定训练和后续 finetuning,因此跨环境泛化成本很高。EgoNav 提出的核心问题是:能不能直接从人类行走数据里学到足够强的 navigation prior,再零样本迁移到 humanoid 机器人。

论文给出一套完整系统:用 5 小时 human walking data 训练 diffusion trajectory predictor,以过去轨迹、融合 color/depth/semantics 的 360 度 visual memory,以及来自冻结 DINOv3 的视频特征为条件,预测 plausible future trajectories;再用 hybrid sampling 和 receding-horizon controller 做实时路径选择。作者在离线 collision avoidance、多模态覆盖评估以及 Unitree G1 零样本真实部署中验证,显示等待开门、绕开人群和避开玻璃墙等行为可以自然涌现。

这篇工作值得收录,因为它展示了一个很强的 robotics pattern:先从 human data 学 navigation prior,再把它投到 humanoid control 上,而不是从机器人数据集里硬堆。对 embodied learning、human-to-robot transfer 和 real-world humanoid generalization,这种路线有明显复用价值。

它没有升到更高一级,是因为当前任务仍聚焦 humanoid navigation,且实证规模还不足以证明这一人类数据优先路线能全面改写更广的 embodied learning 栈。它很强,但还是具体子线中的强推进。

链接