Environment-Grounded Multi-Agent Workflow for Autonomous Penetration Testing

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-03-25
arXiv: 2603.24221

收录解读

随着机器人和工业 OT 系统日益网络化，渗透测试已经不只是传统 IT 环境的问题，而是直接关联到真实 cyber-physical system 的安全评估。现有 LLM-based pentest agent 大多停留在一般网络攻防环境，缺少对机器人环境状态、通信拓扑和 exploit traceability 的持续建模，因此难以在需要人类审计和安全合规的场景中真正落地。

这篇工作提出 environment-grounded multi-agent 架构，把自动化渗透测试建立在共享图式记忆之上：系统在执行过程中动态构建 graph-based memory，显式记录网络拓扑、通信链路、漏洞、利用尝试和环境状态变化。这样 agent 不只是串行试命令，而是围绕环境可观察状态做结构化协作，同时保留完整的 traceability 和 human oversight 接口。

它值得正式收录，因为这不是单纯“让 agent 自动打靶场”，而是把 agentic security workflow 明确推进到了 environment-grounded、graph-memory、可审计执行这一层。对于 agent safety、autonomous red teaming、robotics security 和高风险 agent deployment，这是一种具备直接复用价值的系统模式。

它目前仍是 breakthrough，而不是更高一级，因为公开证据主要来自 ROS/ROS2 CTF 场景和较小规模重复实验，离更广泛企业安全环境或通用 cyber-physical systems 的跨域证明还有距离。它已经展示了清晰的方法价值，但还没有证明自己会成为默认的 autonomous pentesting 基础架构。

链接

论文链接