软件工程与编程智能体
突破级
暂无讲解视频
收录解读
这篇工作的切入点是对的:真正决定多 agent 漏洞发现效果的,往往不是单个模型更聪明,而是 harness 如何定义角色、信息流、工具权限和重试逻辑。它把这个被低估的系统层变量正式化了。
如果 harness synthesis 能被系统搜索和优化,那漏洞发现就从“堆 agent”变成“设计 agentic workflow”。这比单次 finding 更有耐用性,因为它提供的是一类软件安全执行模式。
它值得正式收录,因为仓库一直偏重 agent 能力本身,而这篇补的是 orchestration architecture 这层。对 vuln discovery、code auditing 和高风险 autonomous tooling 都有明显外溢。
它没有更高,是因为当前主要证据还是 source-available vulnerability discovery。更广泛的软件工程任务上,这种 harness synthesis 的统一性还需要继续证明。