Scaling Coding Agents via Atomic Skills

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-04-06
arXiv: 2604.05013

收录解读

当前 coding agents 的主流训练仍然高度依赖 composite tasks，比如 bug fixing 或 issue resolution。这种做法虽然能直接刷 benchmark，但往往让模型在特定任务分布上过拟合，反而不利于形成可迁移的通用软件工程能力。

这篇工作把 coding agent 能力显式拆成五个 atomic skills：code localization、code editing、unit-test generation、issue reproduction 和 code review，并在这些原子技能上做 joint RL。核心价值不只是分数提升，而是把训练目标从“做完整任务”重写成“掌握可组合技能”，从而减轻不同子能力之间的负迁移。

它值得正式收录，因为它为 coding agents 提供了一个更 durable 的训练接口：不是继续堆更大模型或更多 composite data，而是直接对 skill basis 做优化。这种结构化拆分对 agent training、generalization diagnosis 和后续 skill composition 都有明显外溢价值。

它暂时不升到更高一级，原因在于当前证据仍主要集中在 coding domain，且 atomic skill 划分是否会成为更广泛 agent training 的默认接口还需要后续验证。它是很强的方法推进，但还不是通用 agent 学习范式的最终定型。

链接

论文链接