收录解读
LLM 在真实部署里面对的往往不是静态测试集,而是不断变化、混合已知与未知任务的开放测试流。传统 test-time adaptation 多半依赖手工设计的无监督目标,并直接在全参数空间上更新,结果容易破坏源域知识,也缺少对非平稳适应信号可靠性的控制。
这篇工作提出 SyCo,把 open-set test streams 下的 LLM 适应做成 parameter-efficient adaptation。方法通过低秩适配器更新实现快速塑性,并用两条生物启发的控制路径来约束适应:Rac1 把更新限制在对源域知识影响更小的 tail-gradient 子空间,MAPK 则通过分层控制器抑制噪声更新、巩固真正有用的适应。论文同时提出 MOA(Multi-source Open-set Adaptation)设定,把多个源任务训练后的模型放入持续出现已知/未知任务且标签、意图部分重叠的非平稳测试流中评测。
这篇工作值得收录,因为它把 test-time adaptation 从静态、闭集、单源设定推进到更贴近部署现实的 multi-source open-set 流式场景,并且给出了低秩适配器 + 结构化适应控制的可复用模式。对 deployment-time learning、continual adaptation 和 open-world LLM specialization,这是一条很有延展性的路线。
它没有升到更高一级,是因为当前仍主要是在 test-time adaptation 这条活跃子线里做出很强推进,而不是已经改写整个 post-deployment learning 范式。MOA 设定和 SyCo 方法都很有价值,但外部采用信号还需要时间积累。