收录解读
这篇论文针对 NeuroAI 里一个长期存在但经常被忽略的问题:我们通常只看人工神经网络能否预测脑神经反应,也就是单向的 forward predictivity,却很少反过来问脑神经活动是否也足以恢复模型内部表征。如果一个模型只在单向映射上看起来像脑,但其内部大量维度无法被真实神经群体回收,那么这种“对齐”就可能是表面上的。
作者提出 reverse predictivity 这个双向比较指标,用猕猴 inferior temporal cortex 的神经反应去预测 ANN 单元激活,并将其与传统的 model-to-brain 预测一起使用。结果显示,很多 forward predictivity 很高的模型仍包含大量对脑活动不可预测的“biologically inaccessible”维度;相反,猴到猴的映射是近似对称的。论文进一步据此区分出与 IT 共享、具行为相关性并可跨物种泛化的 common units,以及缺乏这种对齐的 unique units,并分析了特征维数、训练目标和对抗鲁棒性对 reverse predictivity 的影响。
这篇值得正式收录,因为它不是单纯再做一个 brain-score 变体,而是把 brain-model comparison 的问题定义从单向拟合推进到双向可恢复性。对仓库的 neuroscience / NeuroAI 条线,它提供了一个明确可复用的诊断接口:不仅要问模型能否拟合脑,也要问脑能否解释模型,这直接影响后续如何判断 biological plausibility、表征冗余与模型内部不可达维度。
它目前还不适合更高一级,因为论文本质上仍是一个强的分析与诊断框架,而不是直接改写模型训练范式或提出新的脑机制理论。虽然有 Nature Machine Intelligence 正式发表、代码、PyPI 工具和 OSF 数据支撑,证据已经很完整,但影响更可能先集中在视觉 NeuroAI 和 brain-model alignment 子方向,因此以 breakthrough 收录更稳。