CUA-Gym: Scaling Verifiable Training Environments and Tasks for Computer-Use Agents

智能体与自主科学突破级暂无讲解视频

收录解读

CUA-Gym 面向 computer-use agents 的训练瓶颈：agent 需要在真实或仿真的软件环境中学习，但可验证、可扩展、可自动生成的训练任务仍然稀缺。

论文把 CUA 训练环境组织成可执行、可判定的任务集合，使模型可以通过 outcome verification 获得 RLVR 式训练信号，而不是只依赖静态演示或文本反馈。

它强调环境和任务的规模化构造，这比单个 GUI benchmark 更接近 agent training infrastructure，可服务于浏览器、桌面和移动端操作能力提升。

它值得正式收录，因为可验证环境是 CUA 从评测走向训练的关键边界，CUA-Gym 给出了可复用的数据和环境扩展方向。