Learning Humanoid Navigation from Human Data

Weizhuo Wang; Yanjie Ze; C. Karen Liu; Monroe Kennedy

强化学习突破级暂无讲解视频

发表时间: 2026-04-01
arXiv: 2604.00416

收录解读

humanoid navigation 通常依赖大量机器人自身数据、任务特定训练和后续 finetuning，因此跨环境泛化成本很高。EgoNav 提出的核心问题是：能不能直接从人类行走数据里学到足够强的 navigation prior，再零样本迁移到 humanoid 机器人。

论文给出一套完整系统：用 5 小时 human walking data 训练 diffusion trajectory predictor，以过去轨迹、融合 color/depth/semantics 的 360 度 visual memory，以及来自冻结 DINOv3 的视频特征为条件，预测 plausible future trajectories；再用 hybrid sampling 和 receding-horizon controller 做实时路径选择。作者在离线 collision avoidance、多模态覆盖评估以及 Unitree G1 零样本真实部署中验证，显示等待开门、绕开人群和避开玻璃墙等行为可以自然涌现。

这篇工作值得收录，因为它展示了一个很强的 robotics pattern：先从 human data 学 navigation prior，再把它投到 humanoid control 上，而不是从机器人数据集里硬堆。对 embodied learning、human-to-robot transfer 和 real-world humanoid generalization，这种路线有明显复用价值。

它没有升到更高一级，是因为当前任务仍聚焦 humanoid navigation，且实证规模还不足以证明这一人类数据优先路线能全面改写更广的 embodied learning 栈。它很强，但还是具体子线中的强推进。

链接

论文链接