推理、记忆与推理时控制 突破级 暂无讲解视频
发表时间
2026-04-01
arXiv
2604.00865

收录解读

Agentic RAG 在多跳问答和复杂知识推理里已经很常见,但随着 reasoning trajectory 变长,失败点也越来越多。很多系统要么只会做失败诊断,要么干脆把整条 retrieval-reasoning pipeline 从头重跑,既贵又浪费已经验证过的正确前缀。Doctor-RAG 的价值就在于把这个 repair 问题拆细。

论文提出 diagnose-and-repair 的统一框架,先做 trajectory-level failure diagnosis 与 localization,把错误归入 coverage-gated taxonomy,并找出最早失败点;然后只在该局部位置做 tool-conditioned local repair,同时最大化复用已验证通过的 reasoning prefixes 和 retrieved evidence。这样一来,错误归因和修复被显式解耦,系统既能更精确定位失败,也避免了昂贵的全流程重跑。

这篇工作值得收录,因为它把 Agentic RAG 的改进方向从‘再跑一次’推进到‘局部失败修复’,这对 agent reliability、tool use 和 retrieval-reasoning orchestration 都有清晰外溢。它不是单一 benchmark 上的 patch,而是一种更耐用的 trajectory repair pattern。

它没有升到更高一级,是因为当前仍主要围绕 multi-hop QA 和若干 Agentic RAG baselines 验证,尚未证明会成为更广泛 agent pipeline 的通用修复接口。它很值得收,但还不到更高层级。

链接