ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory

智能体与自主科学突破级暂无讲解视频

收录解读

ReasoningBank 解决长期运行 agent 的核心缺陷：完成任务后丢弃交互历史，导致无法从成功和失败中积累可迁移策略。

系统把经验压缩成 generalizable reasoning memories，在测试时检索相关记忆指导行动，并在任务结束后写回新经验；MaTTS 进一步用更多交互生成更丰富对比信号来提升记忆质量。

它值得正式收录，因为它把 agent memory 从保存原始轨迹或成功案例，推进到策略级经验蒸馏与 test-time scaling 的闭环，是 self-evolving agents 的基础方法。

它没有更高，是因为实验主要集中在 WebArena 和 SWE-Bench-Verified 等软件/网页任务，真实长期部署中的污染、遗忘、权限和安全边界仍需验证。