软件工程
突破级
暂无讲解视频
收录解读
CoSPlay 针对 coding agents 的一个现实瓶颈:许多场景没有隐藏测试或人工 verifier,模型必须自己构造测试来发现代码缺陷。
方法在测试时让代码生成和单元测试生成进行 cooperative self-play,通过自生成代码和自生成 unit tests 互相暴露错误并迭代修正。
这种机制把 test-time compute 转化为临时验证生态,适合和 coding agent、CI loop、自动修复系统结合,而不是只依赖单次采样。
它值得正式收录,因为它是软件工程 agent 的可复用推理/验证 primitive,连接了自生成测试、代码修复和测试时搜索。