智能体与自主科学
突破级
暂无讲解视频
收录解读
当前 coding agents 的主流训练仍然高度依赖 composite tasks,比如 bug fixing 或 issue resolution。这种做法虽然能直接刷 benchmark,但往往让模型在特定任务分布上过拟合,反而不利于形成可迁移的通用软件工程能力。
这篇工作把 coding agent 能力显式拆成五个 atomic skills:code localization、code editing、unit-test generation、issue reproduction 和 code review,并在这些原子技能上做 joint RL。核心价值不只是分数提升,而是把训练目标从“做完整任务”重写成“掌握可组合技能”,从而减轻不同子能力之间的负迁移。
它值得正式收录,因为它为 coding agents 提供了一个更 durable 的训练接口:不是继续堆更大模型或更多 composite data,而是直接对 skill basis 做优化。这种结构化拆分对 agent training、generalization diagnosis 和后续 skill composition 都有明显外溢价值。
它暂时不升到更高一级,原因在于当前证据仍主要集中在 coding domain,且 atomic skill 划分是否会成为更广泛 agent training 的默认接口还需要后续验证。它是很强的方法推进,但还不是通用 agent 学习范式的最终定型。