ClawGUI: A Unified Framework for Training, Evaluating, and Deploying GUI Agents

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-04-13
arXiv: 2604.11784

收录解读

GUI agents 的瓶颈不只是模型能力，而是缺少完整开放基础设施：训练环境不稳定，评估协议难复现，在线 RL 和真实设备部署经常断裂，导致不同论文结果难比较，也难把 agent 真正放到真实手机或应用上。

ClawGUI 提供训练、评估、部署一体化框架。ClawGUI-RL 支持并行虚拟环境和真实物理设备，结合 GiGPO 与 Process Reward Model 做 dense step-level supervision；整个框架同时覆盖 benchmark、在线 RL、真实设备执行和部署接口。

它值得收录，因为它把 GUI agent 从单个模型/单个 benchmark 推向 full-stack infrastructure。对仓库关注的 agent capability extension、tool use、computer-use/GUI automation，它提供的是可复用实验平台和工程基座，而不是局部 SOTA trick。

局限在于 GUI agent 生态仍早期，ClawGUI 的长期价值取决于社区采用、任务覆盖和真实设备稳定性；因此它是 GUI agent infrastructure 的突破性收录，而不是 paradigm 级结论。

链接

论文链接