CoSPlay: Cooperative Self-Play at Test-Time with Self-Generated Code and Unit Test

软件工程突破级暂无讲解视频

收录解读

CoSPlay 针对 coding agents 的一个现实瓶颈：许多场景没有隐藏测试或人工 verifier，模型必须自己构造测试来发现代码缺陷。

方法在测试时让代码生成和单元测试生成进行 cooperative self-play，通过自生成代码和自生成 unit tests 互相暴露错误并迭代修正。

这种机制把 test-time compute 转化为临时验证生态，适合和 coding agent、CI loop、自动修复系统结合，而不是只依赖单次采样。

它值得正式收录，因为它是软件工程 agent 的可复用推理/验证 primitive，连接了自生成测试、代码修复和测试时搜索。