Geometry Conflict: Explaining and Controlling Forgetting in LLM Continual Post-Training

推理、记忆与推理时控制突破级暂无讲解视频

收录解读

这篇论文处理的是持续后训练里的核心风险：模型学习新能力时会破坏旧能力，而这个问题不是简单调小学习率就能解决。它把 forgetting 解释为几何冲突。

几何视角有复用价值，因为它给 LoRA、continual post-training、domain adaptation 和 capability injection 提供了统一诊断语言。真正重要的不是单个任务分数，而是能力之间怎样发生干扰。

它值得正式收录，因为本库关注长期能力扩展、PEFT 和部署后适应；forgetting control 是这些路线能否工程化的基础问题。

它没有更高，是因为它仍需要在更多训练范式、模型规模和实际能力组合中验证。