智能体与自主科学
突破级
暂无讲解视频
收录解读
EvolveMem 指出当前 agent memory 系统通常只更新存储内容,而检索评分、融合策略和回答策略在部署后固定,导致长期记忆增长时 retrieval infrastructure 不适配。
它把完整 retrieval configuration 暴露为结构化 action space,由 LLM diagnosis module 读取失败日志、定位 root cause、提出配置调整,再由 guarded meta-analyzer 执行、回滚退化并在停滞时探索。
它值得正式收录,因为它把 agent memory 从静态检索组件推进到自演化系统对象,在 LoCoMo 和 MemBench 上相对最强 baseline 有明显提升,并展示跨 benchmark 正迁移。
它没有更高,是因为 AutoResearch 式自调参可能受评价集和诊断质量影响;生产环境的安全边界、成本和可解释回滚还需验证。