智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-04-06
arXiv
2604.05013

收录解读

当前 coding agents 的主流训练仍然高度依赖 composite tasks,比如 bug fixing 或 issue resolution。这种做法虽然能直接刷 benchmark,但往往让模型在特定任务分布上过拟合,反而不利于形成可迁移的通用软件工程能力。

这篇工作把 coding agent 能力显式拆成五个 atomic skills:code localization、code editing、unit-test generation、issue reproduction 和 code review,并在这些原子技能上做 joint RL。核心价值不只是分数提升,而是把训练目标从“做完整任务”重写成“掌握可组合技能”,从而减轻不同子能力之间的负迁移。

它值得正式收录,因为它为 coding agents 提供了一个更 durable 的训练接口:不是继续堆更大模型或更多 composite data,而是直接对 skill basis 做优化。这种结构化拆分对 agent training、generalization diagnosis 和后续 skill composition 都有明显外溢价值。

它暂时不升到更高一级,原因在于当前证据仍主要集中在 coding domain,且 atomic skill 划分是否会成为更广泛 agent training 的默认接口还需要后续验证。它是很强的方法推进,但还不是通用 agent 学习范式的最终定型。

链接