The Human Brain as a Dynamic Mixture of Expert Models in Video Understanding

神经科学与认知科学突破级暂无讲解视频

收录解读

这篇 ICLR 2026 论文把 NeuroAI 的 model-brain alignment 从静态图像和 fMRI 扩展到动态视频 EEG，并系统比较 100+ 个视频/视觉模型。

方法上，作者提出 Cross-Temporal RSA，用时间展开的模型特征去匹配不断演化的 EEG 响应，形成大规模动态对齐评测，而不是只问某个模型和脑活动总体相似不相似。

关键发现是，不同脑区和时间段偏好的模型能力不同：后部电极更贴近具有时间整合的中层动作特征，额叶更贴近高层静态动作表征，state-space/video temporal integration 和自监督预训练对部分后部活动更有利。

它值得正式收录，因为它提供了 AI 视频模型和人脑动态视觉处理之间的可复用评测接口，并把单一最佳模型的假设改写成动态 expert switching，这对视频模型架构、MoE/路由、时序表征学习和 NeuroAI 都有明确外溢。