Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

理论、鲁棒性与核心机器学习突破级暂无讲解视频

发表时间: 2026-03-12
arXiv: 2603.12228

收录解读

这篇论文挑战了一个默认前提：后训练是否真的在学习全新能力，还是更多在预训练权重附近选择已经潜伏存在的任务专家。作者提出 large pretrained models 并不只对应一个单点解，而是位于一个局部高密度的“专家丛林”之中；当预训练足够强时，对权重做小幅随机扰动，就可能落到不同任务的可用专家上。

方法上的核心不是复杂优化，而是一个刻意极简的后训练基线 RandOpt：围绕预训练权重随机采样多个扰动，选出更优候选，再做集成。论文显示，这种几乎不依赖梯度优化的简单过程，在若干任务上能够逼近甚至比肩标准 post-training 方法。它真正新的是把 post-training 重新解释为对预训练邻域中潜在行为的选择，而不是总要通过昂贵优化去发明新行为。

这项工作值得收录，因为它对后训练、对齐和能力形成机制给出了一个很强的问题重述。它不只是提出一个小 trick，而是在追问 RLHF、PPO、GRPO 一类方法到底在做什么，这对后训练研究、模型编辑和权重空间理解都有直接外溢价值。对于仓库来说，它属于高信号的理论/机制型突破。

它还不到更高一级，原因是当前主要证据集中在特定模型和任务上的权重邻域分析，是否能普遍解释更广泛的大模型后训练过程，还需要更多模型族、尺度和方法学验证。因此目前更稳的定位是高位 breakthrough，而不是已经坐实的 disruptive。

链接

论文链接