对应论文

RoboSemanticBench: Diagnosing Semantic Grounding in Action Prediction for VLA Models

视频简介

VLA 模型声称语言语义能指导动作,但很多评测可能被视觉捷径或 instruction-action shortcuts 解决。 RoboSemanticBench 让机器人根据数学/常识多选题选择并抓取正确答案积木,直接测试 VLA 是否能把复杂语义映射到物理动作目标。 它值得收录,因为它提供了 VLA semantic grounding 的诊断 benchmark,有助于区分真实语义控制和模仿捷径。 按当前收录规则,它属于近期值得正式跟踪的可复用方法或系统模式;但作为新近预印本,后续仍需要代码、复现和真实部署结果来确认长期影响。

外部视频链接

论文链接