理论、鲁棒性与核心机器学习
突破级
暂无讲解视频
收录解读
这篇论文挑战了一个默认前提:后训练是否真的在学习全新能力,还是更多在预训练权重附近选择已经潜伏存在的任务专家。作者提出 large pretrained models 并不只对应一个单点解,而是位于一个局部高密度的“专家丛林”之中;当预训练足够强时,对权重做小幅随机扰动,就可能落到不同任务的可用专家上。
方法上的核心不是复杂优化,而是一个刻意极简的后训练基线 RandOpt:围绕预训练权重随机采样多个扰动,选出更优候选,再做集成。论文显示,这种几乎不依赖梯度优化的简单过程,在若干任务上能够逼近甚至比肩标准 post-training 方法。它真正新的是把 post-training 重新解释为对预训练邻域中潜在行为的选择,而不是总要通过昂贵优化去发明新行为。
这项工作值得收录,因为它对后训练、对齐和能力形成机制给出了一个很强的问题重述。它不只是提出一个小 trick,而是在追问 RLHF、PPO、GRPO 一类方法到底在做什么,这对后训练研究、模型编辑和权重空间理解都有直接外溢价值。对于仓库来说,它属于高信号的理论/机制型突破。
它还不到更高一级,原因是当前主要证据集中在特定模型和任务上的权重邻域分析,是否能普遍解释更广泛的大模型后训练过程,还需要更多模型族、尺度和方法学验证。因此目前更稳的定位是高位 breakthrough,而不是已经坐实的 disruptive。