智能体与自主科学
突破级
暂无讲解视频
收录解读
这篇论文抓的是 mobile agent 研究里的一个现实问题:闭源系统已经把成功率推得很高,但关键训练数据和任务/轨迹合成流程都不透明,开源侧很难追。OpenMobile 不是单纯开个模型,而是把任务指令生成和 agent trajectory synthesis 这条数据管线公开化。
方法上,它有两个关键部件:一是基于探索构建 global environment memory,再据此生成 grounded、diverse 的任务指令;二是 learner/expert 交替的 policy-switching rollout,用来显式捕获 error-recovery 数据,而不是只收集顺利轨迹。结果上,开源数据训练的 Qwen2.5-VL / Qwen3-VL 在 AndroidWorld 等 benchmark 上明显优于现有 open-data 路线。
它值得正式收录,因为这里贡献的是 mobile agent training workflow,而不是单次 benchmark tuning。对于移动端 agent、open data synthesis、trajectory curation 和 recovery-aware imitation / post-training 都有方法外溢。
它没有升到更高等级,是因为目前主要影响仍集中在 mobile GUI/task automation 赛道,是否能推广为更一般的 computer-use agent 数据引擎还需要更多跨平台验证。