智能体与自主科学 突破级 有讲解视频
发表时间
2026-03-15
arXiv
2603.14332

收录解读

随着 agent 开始动态获取工具、组织子 agent 并跨组织边界执行任务,真正的问题已经不只是 prompt injection,而是 capability 本身如何被绑定、验证和审计。现有 agent framework 往往把工具定义、用户上下文和执行声明都塞进同一 token stream,导致 orchestration 层缺少可证明的 capability semantics。

这篇工作的核心贡献,是把 governed agent ecosystem 形式化为 capability integrity、behavioral verifiability 和 interaction auditability 三类要求,并进一步给出 cryptographic binding、replay-based verification 与可替换 crypto instantiation 的架构实现。论文还提供 chain verifiability 与 bounded divergence 两个结构性结果,把 agent tool use 的治理问题从经验性工程补丁提升为可推理的系统边界模型。

它值得正式收录,因为这不是又一个 narrow guardrail,而是 agent governance primitive。对本仓库已收录的 governed execution、workflow verification、guardrails infrastructure 主线来说,它补上了 capability provenance 和 interaction-level verification 这一层,具备明显的长期基础设施价值。

它没有升到更高一级,是因为当前仍主要以方案完整性、攻击检测和低开销实验来证明可行性,外部生态默认采用还没有形成。现阶段它更像一个很强的 governed-tool-use blueprint,而不是已经成为行业默认边界模型的事实标准。

解读视频

链接