机器人与具身智能
突破级
暂无讲解视频
收录解读
这篇论文提出一个反直觉但重要的 embodied LLM 评估发现:更高保真观察不一定带来更强问题求解。
作者在物理 Lockbox 机械谜题和受控仿真中比较 RGB、RGB-D 和 ground-truth symbolic observations,发现原始 RGB 最好、完美符号观察最差;适度噪声反而能减少重复动作循环。
它值得正式收录,因为它提醒机器人/具身 agent 评估不能只看成功率,也不能默认 perception fidelity 越高越好;表现可能来自感知误差与推理缺陷的交互。
它没有更高,是因为任务仍是特定机械谜题,结论需要在更复杂机器人控制和 VLA 系统中复现。