SEVerA: Verified Synthesis of Self-Evolving Agents

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-03-26
arXiv: 2603.25111

收录解读

self-evolving agents 这条线越来越强，但大多数框架只关心 planner 能否自动生成和改写 agent program，几乎不对 autonomy 带来的安全性、约束遵守和 correctness 给出形式保证。一旦这些程序在未见输入上自动执行，这个缺口就会直接变成 reliability 和 security 风险。

SEVerA 的核心推进，是把 agentic code generation 改写成带 hard constraints 的学习问题，并用 Formally Guarded Generative Models 为每次生成调用加 formal output contract。每个 generative call 都由 rejection sampler 和 verified fallback 包住，于是 planner 搜索、verification 证明和 learning 优化可以组合起来：软目标继续优化，但硬约束始终不被违反。

它值得正式收录，因为这条路线把 formal methods 真正接到了 self-evolving agents 的核心循环里，而不是做外围 guardrail。对安全 agent synthesis、tool-using agents 和可验证的 self-improvement，这是一条很清晰的 durable pattern。

它暂时不升到更高一级，原因在于当前 formal contract 的表达能力和任务覆盖还有限，主要验证也集中在 Dafny、symbolic math 和 policy-compliant tool use。它非常强，但还没证明自己会成为更广 agent synthesis 的默认接口。

链接

论文链接