OpenMobile: Building Open Mobile Agents with Task and Trajectory Synthesis

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-04-24
arXiv: 2604.15093

收录解读

这篇论文抓的是 mobile agent 研究里的一个现实问题：闭源系统已经把成功率推得很高，但关键训练数据和任务/轨迹合成流程都不透明，开源侧很难追。OpenMobile 不是单纯开个模型，而是把任务指令生成和 agent trajectory synthesis 这条数据管线公开化。

方法上，它有两个关键部件：一是基于探索构建 global environment memory，再据此生成 grounded、diverse 的任务指令；二是 learner/expert 交替的 policy-switching rollout，用来显式捕获 error-recovery 数据，而不是只收集顺利轨迹。结果上，开源数据训练的 Qwen2.5-VL / Qwen3-VL 在 AndroidWorld 等 benchmark 上明显优于现有 open-data 路线。

它值得正式收录，因为这里贡献的是 mobile agent training workflow，而不是单次 benchmark tuning。对于移动端 agent、open data synthesis、trajectory curation 和 recovery-aware imitation / post-training 都有方法外溢。

它没有升到更高等级，是因为目前主要影响仍集中在 mobile GUI/task automation 赛道，是否能推广为更一般的 computer-use agent 数据引擎还需要更多跨平台验证。

链接

论文链接项目