安全、治理与可靠性
突破级
暂无讲解视频
收录解读
LiSA 针对 agent guardrails 的部署难题:工具调用、私有数据读取和多步工作流中的安全规则高度依赖本地政策、组织规范和用户期待。
它不反复微调 base guardrail,而是把稀疏失败报告归纳成可复用 policy abstractions,用 conflict-aware local rules 防止过度泛化,并用 evidence-aware confidence 控制更新。
它值得正式收录,因为安全系统需要 lifelong adaptation;LiSA 把 guardrail 从静态规则推进到保守、可记忆、可局部适应的安全层。
它没有更高,是因为真实部署反馈往往带偏差、延迟和低覆盖,policy induction 的长期安全性还需更多实证。