智能体与自主科学
突破级
暂无讲解视频
收录解读
ReasoningBank 解决长期运行 agent 的核心缺陷:完成任务后丢弃交互历史,导致无法从成功和失败中积累可迁移策略。
系统把经验压缩成 generalizable reasoning memories,在测试时检索相关记忆指导行动,并在任务结束后写回新经验;MaTTS 进一步用更多交互生成更丰富对比信号来提升记忆质量。
它值得正式收录,因为它把 agent memory 从保存原始轨迹或成功案例,推进到策略级经验蒸馏与 test-time scaling 的闭环,是 self-evolving agents 的基础方法。
它没有更高,是因为实验主要集中在 WebArena 和 SWE-Bench-Verified 等软件/网页任务,真实长期部署中的污染、遗忘、权限和安全边界仍需验证。