PlugMem: A Task-Agnostic Plugin Memory Module for LLM Agents

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-02-06
arXiv: 2603.03296

收录解读

长期运行的 LLM agent 需要 memory，但现有方案通常在两个极端之间摇摆：要么针对单一任务做重工程化设计，迁移性差；要么直接检索原始轨迹，导致上下文膨胀、任务相关性不足、真正决策时噪声过高。PlugMem 针对的就是这个通用 memory module 缺口。

它把 memory 单元从原始 experience 改成 knowledge-centric graph 中的知识块，并显式区分 propositional knowledge 与 prescriptive knowledge。系统由 structuring、retrieval、reasoning 三层组成：先把异构 episodic trace 抽象为更紧凑的知识图，再做 abstraction-aware retrieval，最后按当前任务进一步压缩和组织成可用上下文。

这篇工作的价值在于它不是再做一个只适配某个 benchmark 的 memory trick，而是在 agent memory 这条主线上提出了更可复用的通用接口：memory 的组织与访问单位应该是 decision-relevant knowledge，而不是 entity、text chunk 或原始轨迹。它还在 LongMemEval、HotpotQA 和 WebArena 三类异构任务上用同一模块验证了跨任务可迁移性。

它当前仍是 breakthrough 而不是更高一级，因为证据仍主要来自 arXiv 论文和有限 benchmark 组合，离真正成为长期 agent memory 默认架构还有距离；同时 structuring 与 reasoning 质量仍依赖底层 LLM，跨模型、跨成本预算和长周期生产环境下的稳定性还需要更多验证。

链接

论文链接