Weight Tying Biases Token Embeddings Towards the Output Space

可解释性与机制分析突破级暂无讲解视频

发表时间: 2026-03-27
arXiv: 2603.26663

收录解读

权重绑定长期被当作语言模型里的标准参数节省技巧，但随着模型规模增大，越来越多新模型开始放弃 tying。过去这更多被当作经验工程选择，而不是一个被充分解释的机制问题。

这篇工作从结构对齐、tuned lens 和梯度流角度系统分析了权重绑定的代价。作者发现共享嵌入矩阵会明显向输出空间偏移，而根本原因是训练初期输出梯度对共享矩阵具有压倒性主导。进一步的分析还揭示了早期层因此承受 first-layer penalty，说明 tying 不是中性的参数共享，而是对输入表征的系统性扭曲。

它值得正式收录，因为它给出了一个很典型的 mechanistic explanation：不是简单说 untied 更好，而是解释了为什么共享矩阵会被 unembedding 需求绑架。这对 embedding 设计、参数共享策略以及现代 LLM 架构演进都有持续解释价值。

它暂时不升到更高一级，原因在于论文更像强诊断而不是完整解法。它说明了问题和因果链条，但尚未提出一个同时保持参数效率又稳定消除偏置的新范式。

链接

论文链接