Synthesizing Multi-Agent Harnesses for Vulnerability Discovery

Hanzhi Liu; Chaofan Shou; Xiaonan Liu; Hongbo Wen; Yanju Chen; Ryan Jingyang Fang; Yu Feng

软件工程与编程智能体突破级暂无讲解视频

策展与解读：DAST AI · 收录方法与内容透明度

发表时间: 2026-04-22
arXiv: 2604.20801

收录解读

这篇工作的切入点是对的：真正决定多 agent 漏洞发现效果的，往往不是单个模型更聪明，而是 harness 如何定义角色、信息流、工具权限和重试逻辑。它把这个被低估的系统层变量正式化了。

如果 harness synthesis 能被系统搜索和优化，那漏洞发现就从“堆 agent”变成“设计 agentic workflow”。这比单次 finding 更有耐用性，因为它提供的是一类软件安全执行模式。

它值得正式收录，因为仓库一直偏重 agent 能力本身，而这篇补的是 orchestration architecture 这层。对 vuln discovery、code auditing 和高风险 autonomous tooling 都有明显外溢。

它没有更高，是因为当前主要证据还是 source-available vulnerability discovery。更广泛的软件工程任务上，这种 harness synthesis 的统一性还需要继续证明。

原始摘要与中文对照

中文对照翻译

LLM智能体已开始在源代码可用的目标中发现人类审计员和自动化模糊测试器几十年来一直未能发现的真实安全漏洞，在这些目标中，分析师可以构建和检测代码。在实践中，这项工作被分配给多个智能体，并通过一个harness连接在一起：harness是一个程序，它规定了哪些角色存在、它们如何传递信息、每个角色可以调用哪些工具以及如何重试。

原始摘要

LLM agents have begun to find real security vulnerabilities that human auditors and automated fuzzers missed for decades, in sourceavailable targets where the analyst can build and instrument the code. In practice the work is split among several agents, wired together by a harness: the program that fixes which roles exist, how they pass information, which tools each may call, and how retries

链接

论文链接