智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-02-06
arXiv
2603.03296

收录解读

长期运行的 LLM agent 需要 memory,但现有方案通常在两个极端之间摇摆:要么针对单一任务做重工程化设计,迁移性差;要么直接检索原始轨迹,导致上下文膨胀、任务相关性不足、真正决策时噪声过高。PlugMem 针对的就是这个通用 memory module 缺口。

它把 memory 单元从原始 experience 改成 knowledge-centric graph 中的知识块,并显式区分 propositional knowledge 与 prescriptive knowledge。系统由 structuring、retrieval、reasoning 三层组成:先把异构 episodic trace 抽象为更紧凑的知识图,再做 abstraction-aware retrieval,最后按当前任务进一步压缩和组织成可用上下文。

这篇工作的价值在于它不是再做一个只适配某个 benchmark 的 memory trick,而是在 agent memory 这条主线上提出了更可复用的通用接口:memory 的组织与访问单位应该是 decision-relevant knowledge,而不是 entity、text chunk 或原始轨迹。它还在 LongMemEval、HotpotQA 和 WebArena 三类异构任务上用同一模块验证了跨任务可迁移性。

它当前仍是 breakthrough 而不是更高一级,因为证据仍主要来自 arXiv 论文和有限 benchmark 组合,离真正成为长期 agent memory 默认架构还有距离;同时 structuring 与 reasoning 质量仍依赖底层 LLM,跨模型、跨成本预算和长周期生产环境下的稳定性还需要更多验证。

链接