The Price Is Not Right: Neuro-Symbolic Methods Outperform VLAs on Structured Long-Horizon Manipulation Tasks with Significantly Lower Energy Consumption

强化学习突破级暂无讲解视频

收录解读

问题与背景：VLA 被视为通用机器人策略路径，但长程结构化任务是否必须依赖端到端基础模型并不清楚。论文用相同任务和能耗指标正面比较 VLA fine-tuning 与 neuro-symbolic planning。

方法与新意：对照系统把 PDDL 符号规划和学习型低层控制组合起来，与微调的开放 VLA 在 Towers of Hanoi 操作任务上比较成功率、未见 4-block 泛化、训练能耗和运行能耗。结果显示 neuro-symbolic 在成功率和能效上明显优于 VLA。

收录意义：这篇的价值不是提出新 VLA，而是给机器人长程任务提供了一个清晰的反例和评测框架：显式结构、规划约束和低层学习的组合在某些任务上比端到端 VLA 更可靠、更省能。它对 embodied AI 的架构选择有可复用警示价值。

局限：任务仍是结构化仿真操作，领域范围窄，不能推出所有机器人任务都应回到符号规划；因此作为 breakthrough 反例和评测证据收录，而不是更高等级。