Probing Embodied LLMs: When Higher Observation Fidelity Hurts Problem Solving

机器人与具身智能突破级暂无讲解视频

收录解读

这篇论文提出一个反直觉但重要的 embodied LLM 评估发现：更高保真观察不一定带来更强问题求解。

作者在物理 Lockbox 机械谜题和受控仿真中比较 RGB、RGB-D 和 ground-truth symbolic observations，发现原始 RGB 最好、完美符号观察最差；适度噪声反而能减少重复动作循环。

它值得正式收录，因为它提醒机器人/具身 agent 评估不能只看成功率，也不能默认 perception fidelity 越高越好；表现可能来自感知误差与推理缺陷的交互。

它没有更高，是因为任务仍是特定机械谜题，结论需要在更复杂机器人控制和 VLA 系统中复现。