Learning from Many and Adapting to the Unknown in Open-set Test Streams

推理、记忆与推理时控制突破级有讲解视频

发表时间: 2026-04-01
arXiv: 2604.00533

收录解读

LLM 在真实部署里面对的往往不是静态测试集，而是不断变化、混合已知与未知任务的开放测试流。传统 test-time adaptation 多半依赖手工设计的无监督目标，并直接在全参数空间上更新，结果容易破坏源域知识，也缺少对非平稳适应信号可靠性的控制。

这篇工作提出 SyCo，把 open-set test streams 下的 LLM 适应做成 parameter-efficient adaptation。方法通过低秩适配器更新实现快速塑性，并用两条生物启发的控制路径来约束适应：Rac1 把更新限制在对源域知识影响更小的 tail-gradient 子空间，MAPK 则通过分层控制器抑制噪声更新、巩固真正有用的适应。论文同时提出 MOA（Multi-source Open-set Adaptation）设定，把多个源任务训练后的模型放入持续出现已知/未知任务且标签、意图部分重叠的非平稳测试流中评测。

这篇工作值得收录，因为它把 test-time adaptation 从静态、闭集、单源设定推进到更贴近部署现实的 multi-source open-set 流式场景，并且给出了低秩适配器 + 结构化适应控制的可复用模式。对 deployment-time learning、continual adaptation 和 open-world LLM specialization，这是一条很有延展性的路线。

它没有升到更高一级，是因为当前仍主要是在 test-time adaptation 这条活跃子线里做出很强推进，而不是已经改写整个 post-deployment learning 范式。MOA 设定和 SyCo 方法都很有价值，但外部采用信号还需要时间积累。

解读视频

B 站 YouTube

链接

论文链接