LiSA: Lifelong Safety Adaptation via Conservative Policy Induction

安全、治理与可靠性突破级暂无讲解视频

收录解读

LiSA 针对 agent guardrails 的部署难题：工具调用、私有数据读取和多步工作流中的安全规则高度依赖本地政策、组织规范和用户期待。

它不反复微调 base guardrail，而是把稀疏失败报告归纳成可复用 policy abstractions，用 conflict-aware local rules 防止过度泛化，并用 evidence-aware confidence 控制更新。

它值得正式收录，因为安全系统需要 lifelong adaptation；LiSA 把 guardrail 从静态规则推进到保守、可记忆、可局部适应的安全层。

它没有更高，是因为真实部署反馈往往带偏差、延迟和低覆盖，policy induction 的长期安全性还需更多实证。