推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
MemReread 针对 agent memory 的一个具体失败模式:线性读文档时动态记忆会覆盖掉潜在证据,而后续检索又可能被无效 query 干扰。
它保留 streaming reading 的效率,但在最终记忆不足时触发问题分解和 rereading,从而恢复早期丢失的间接事实,并用 RL 学习何时、读几遍。
它值得正式收录,因为它把长上下文推理从静态扩窗转向 memory-guided rereading,是低成本长文档 agent 的可复用控制机制。
它没有更高,是因为它仍需在更多开放式任务、长时程 agent 和多模态材料上验证。