强化学习 突破级 暂无讲解视频
发表时间
2025-06-01

收录解读

这篇 CVPR 2025 论文提出 manual-based appliance manipulation benchmark:机器人需要阅读说明书、理解设备结构和操作步骤,再完成真实/仿真的家电操作。它把文档理解和具身操作结合到同一任务里。

它的关键价值在于评估 embodied agent 如何使用外部程序性知识,而不是只依赖预训练策略记忆。说明书作为工具性知识源,能测试检索、视觉 grounding、长程规划和动作执行的完整链条。

按本库标准,它进入正式收录,因为它定义了一个有复用价值的具身智能评测问题:机器人按文档完成未见设备操作。这对家庭机器人、服务机器人和工具使用 agent 都有外溢意义。

局限是 benchmark 场景与真实家电多样性、接触物理和安全约束之间仍有差距;从评测到部署还需要更多实机验证。

链接