推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
LoRA 常被当作知识更新和能力注入接口,但它到底能记住多少、如何记、何时会精确回忆,仍缺少定量规律。
这篇论文把 LoRA 用作 latent-space parametric memory probe,提出 Parametric Memory Law,将 loss reduction、effective parameters 和 sequence length 连接成 power law。
论文还在 token 级发现确定性相变:当预测概率超过阈值时,greedy decoding 下 verbatim recall 成为可预期结果,并据此提出 threshold-guided MemFT。
它值得收录,因为它把 LoRA/PEFT 从经验调参推进到 parametric memory capacity 的可测量规律,对模型记忆、持续更新、模块化知识注入和遗忘控制都有直接价值。