推理、记忆与推理时控制 突破级 暂无讲解视频
发表时间
2026-05-11
arXiv
2605.10268

收录解读

MemReread 针对 agent memory 的一个具体失败模式:线性读文档时动态记忆会覆盖掉潜在证据,而后续检索又可能被无效 query 干扰。

它保留 streaming reading 的效率,但在最终记忆不足时触发问题分解和 rereading,从而恢复早期丢失的间接事实,并用 RL 学习何时、读几遍。

它值得正式收录,因为它把长上下文推理从静态扩窗转向 memory-guided rereading,是低成本长文档 agent 的可复用控制机制。

它没有更高,是因为它仍需在更多开放式任务、长时程 agent 和多模态材料上验证。

链接