Stateless Decision Memory for Enterprise AI Agents

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-04-22
arXiv: 2604.20158

收录解读

这篇论文有价值的地方，不是再造一个更复杂的 agent memory，而是直接反过来问：为什么企业在受监管决策场景里，明明需要长程上下文，却依然偏好看起来更弱的 retrieval pipeline？作者给出的答案很明确：真正 load-bearing 的不是‘记得更多’，而是 deterministic replay、auditable rationale、multi-tenant isolation 和 stateless horizontal scale。

在这个 framing 下，论文提出的 DPM 并不是传统 stateful memory，而是 append-only event log 加上 decision-time projection。这个设计把不确定性压缩到更少的 LLM 调用，把审计面从 N 次总结链路缩成 one-versus-N 结构，同时在 budget 紧的时候比 summarization memory 更准、更快。它本质上是在 regulated enterprise agent 上把 memory 问题重新定义成可回放的 decision substrate。

它值得正式收录，因为这不是一个窄 benchmark trick，而是 agent memory 在企业落地中的一条清晰架构边界：当审计、复现和水平扩展是硬约束时，stateful memory 可能从根上就不合适。这个判断对 underwriting、claims、tax、compliance 乃至更广的 governed execution 都有很强外溢。

它没有更高，是因为当前证据还主要来自十个案例、单论文作者和较新的评测设置；是否会成为 regulated agent 的默认 memory pattern，还要看外部复现和真实部署采用。

链接

论文链接