推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
这篇论文重新定义 RAG 的控制接口:传统 RAG 把检索当成外部模块或独立 controller,模型生成与检索决策往往松耦合,尤其在多步问题中容易出现检索时机、查询改写和终止条件不协调。
作者提出 Retrieval as Generation,并实现 GRIP:模型通过生成控制 token 自己决定何时检索、如何重写 query、何时停止检索,把信息规划嵌入同一条自回归轨迹。Self-Triggered Information Planning 让 retrieval control 成为 generation policy 的一部分,而不是外接分类器或固定流程。
它值得收录,因为它把 RAG 从“检索增强生成”推进到“生成式检索控制”,和仓库关注的 agent memory、reasoning control、test-time evidence use 高度相关。这个接口对长程问答、知识密集推理和可学习检索策略都有可复用价值。
局限在于这类方法对训练数据、控制 token 设计和 retrieval backend 仍敏感;是否能稳定迁移到复杂 agent memory 或开放科学检索任务,还需要更多验证。因此它是突破性 RAG 控制框架,而不是最终范式。