智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-05-18
arXiv
2605.18703

收录解读

EnvFactory 解决 agentic RL 的核心瓶颈:缺少可扩展、真实、可执行且鲁棒的工具环境,以及能反映隐式人类意图的训练轨迹。

系统从真实资源自动探索和验证 stateful executable tool environments,再通过拓扑采样和校准细化生成自然多轮轨迹,用于 SFT/RL。

它值得正式收录,因为它把环境构造、轨迹合成和工具使用 RL 打通成可复用工厂,降低 agent training 对真实 API 和人工数据的依赖。

它没有更高,是因为当前环境数量、领域覆盖和真实 API 迁移还有限,自动生成环境的安全性也需要持续审计。

链接