Reverse predictivity for bidirectional comparison of neural networks and biological brains

神经科学与认知科学突破级暂无讲解视频

发表时间: 2026-03-25
DOI: 10.1038/s42256-026-01204-0

收录解读

这篇论文针对 NeuroAI 里一个长期存在但经常被忽略的问题：我们通常只看人工神经网络能否预测脑神经反应，也就是单向的 forward predictivity，却很少反过来问脑神经活动是否也足以恢复模型内部表征。如果一个模型只在单向映射上看起来像脑，但其内部大量维度无法被真实神经群体回收，那么这种“对齐”就可能是表面上的。

作者提出 reverse predictivity 这个双向比较指标，用猕猴 inferior temporal cortex 的神经反应去预测 ANN 单元激活，并将其与传统的 model-to-brain 预测一起使用。结果显示，很多 forward predictivity 很高的模型仍包含大量对脑活动不可预测的“biologically inaccessible”维度；相反，猴到猴的映射是近似对称的。论文进一步据此区分出与 IT 共享、具行为相关性并可跨物种泛化的 common units，以及缺乏这种对齐的 unique units，并分析了特征维数、训练目标和对抗鲁棒性对 reverse predictivity 的影响。

这篇值得正式收录，因为它不是单纯再做一个 brain-score 变体，而是把 brain-model comparison 的问题定义从单向拟合推进到双向可恢复性。对仓库的 neuroscience / NeuroAI 条线，它提供了一个明确可复用的诊断接口：不仅要问模型能否拟合脑，也要问脑能否解释模型，这直接影响后续如何判断 biological plausibility、表征冗余与模型内部不可达维度。

它目前还不适合更高一级，因为论文本质上仍是一个强的分析与诊断框架，而不是直接改写模型训练范式或提出新的脑机制理论。虽然有 Nature Machine Intelligence 正式发表、代码、PyPI 工具和 OSF 数据支撑，证据已经很完整，但影响更可能先集中在视觉 NeuroAI 和 brain-model alignment 子方向，因此以 breakthrough 收录更稳。

链接

论文链接