ClawGUI: A Unified Framework for Training, Evaluating, and Deploying GUI Agents

智能体与自主科学突破级暂无讲解视频

收录解读

这篇论文把 GUI agent 的问题从单纯模型能力推进到完整工程栈：训练、评测和部署必须在同一个可复现实验框架里闭环，否则 GUI agent 的进展会被环境不稳定、评测漂移和部署断层拖住。

ClawGUI 的核心贡献是提供 ClawGUI-RL、ClawGUI-Eval 和 ClawGUI-Agent 三层基础设施，覆盖在线 RL、标准化 benchmark 复现和真实移动设备接入。这比单个 GUI benchmark 或单个模型报告更有长期工程复用价值。

按本库标准，它应进入 agent 系统/能力扩展方向，因为它提供了可运行的 GUI agent 训练与部署接口，且面向真实 Android、HarmonyOS、iOS 使用场景。

局限是 GUI agent 本身仍处在低成功率阶段，ClawGUI-2B 的绝对能力并不高；论文价值主要在基础设施而非当前模型性能。