推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
这篇论文落在 test-time memory 和 inference-time adaptation 的交叉点。它关注的不是把更多上下文塞进模型,而是在测试时形成、转化和巩固可用记忆。
Mela 的价值在于把 memory consolidation 明确变成推理期机制。对长期 agent 来说,记忆系统不能只做检索,还要在任务过程中把局部经验转成后续可用的状态。
它值得正式收录,因为 test-time learning、agent memory 和长上下文控制正在合流;Mela 提供了一个可复用的问题设定和机制方向。
它没有更高,是因为 test-time memory 容易在少数任务上有效,是否能稳定迁移到开放 agent 和多日任务还需要更多证据。