MCP Pitfall Lab: Exposing Developer Pitfalls in MCP Tool Server Security under Multi-Vector Attacks

安全、治理与可靠性突破级暂无讲解视频

发表时间: 2026-04-23
arXiv: 2604.21477

收录解读

这篇论文的关键价值在于，它没有把 MCP 安全问题停留在‘又发现了一种 prompt attack’层面，而是把 developer pitfalls 变成了可以复现实验、可以 trace-grounded 验证、还能直接给出 hardening 成本的 protocol-aware security lab。

MCP Pitfall Lab 覆盖 tool-metadata poisoning、puppet servers、multimodal image-to-tool chains 等多向量攻击，并把评估建立在 MCP traces 和 objective validators 上，而不是让 agent 自己汇报是否安全。这一点非常重要，因为它把 MCP 安全从 narrative 式 demo 拉回到了 regression-test 和工程加固范式。

它值得正式收录，因为这是典型的 durable safety workflow：有可重放场景、有客观验证、有 hardened baseline、有 LOC 级加固成本。对于 MCP / tool-use agent 安全，这类测试基座会长期有用。

它没有更高，是因为当前实验范围仍围绕几个典型 workflow 和 server variants，距离成为整个 agent tool-security 社区的默认 test harness 还需要 adoption。

链接

论文链接