Optimal Brain Decomposition for Accurate LLM Low-Rank Approximation

推理、记忆与推理时控制突破级暂无讲解视频

发表时间: 2026-04-01
arXiv: 2604.00821

收录解读

低秩分解已经成为 LLM 压缩、部署和高效适配中的常见工具，但很多方法仍主要围绕输入侧激活白化或简单 SVD 展开，对分解误差与模型损失之间的关系建模并不充分。这使得不少低秩近似方法虽然实用，却仍然更像经验手艺而不是真正最优的分解方案。OBD-LLM 针对的就是这个问题。

论文利用二阶 Hessian 信息重新推导 LLM 权重分解问题，通过 Kronecker 因子化显示最优分解需要同时考虑层的输入与输出信息，而不是只看输入统计。基于这一点，作者提出 bi-directional whitening 的 loss-aware decomposition，并给出 closed-form solution，用更严格的模型空间视角取代单侧白化近似。实验上，相比 SVD-LLM 等已有方法报告了约 20% 到 40% 的改进。

这篇工作值得收录，因为它把低秩分解从经验性压缩技巧推进成更清晰的二阶优化对象。对仓库关注的低秩方法、模型压缩和可复用适配接口来说，这种从 Hessian 结构出发的 closed-form decomposition 有明显长期价值，不只是一次局部提分。

它没有升到更高一级，是因为当前影响仍主要集中在 LLM low-rank approximation 这条子线，外溢范围还不足以重写更广泛的 PEFT 或部署范式。它是很强的方法推进，但暂时还不是路线级变化。

链接

论文链接