安全、治理与可靠性 突破级 暂无讲解视频
发表时间
2026-05-14
arXiv
2605.14454

收录解读

LiSA 针对 agent guardrails 的部署难题:工具调用、私有数据读取和多步工作流中的安全规则高度依赖本地政策、组织规范和用户期待。

它不反复微调 base guardrail,而是把稀疏失败报告归纳成可复用 policy abstractions,用 conflict-aware local rules 防止过度泛化,并用 evidence-aware confidence 控制更新。

它值得正式收录,因为安全系统需要 lifelong adaptation;LiSA 把 guardrail 从静态规则推进到保守、可记忆、可局部适应的安全层。

它没有更高,是因为真实部署反馈往往带偏差、延迟和低覆盖,policy induction 的长期安全性还需更多实证。

链接