软件工程 突破级 暂无讲解视频
发表时间
2026-05-22
arXiv
2605.23491

收录解读

CoSPlay 针对 coding agents 的一个现实瓶颈:许多场景没有隐藏测试或人工 verifier,模型必须自己构造测试来发现代码缺陷。

方法在测试时让代码生成和单元测试生成进行 cooperative self-play,通过自生成代码和自生成 unit tests 互相暴露错误并迭代修正。

这种机制把 test-time compute 转化为临时验证生态,适合和 coding agent、CI loop、自动修复系统结合,而不是只依赖单次采样。

它值得正式收录,因为它是软件工程 agent 的可复用推理/验证 primitive,连接了自生成测试、代码修复和测试时搜索。

链接