神经科学与认知科学
突破级
暂无讲解视频
收录解读
这篇 ICLR 2026 论文把 NeuroAI 的 model-brain alignment 从静态图像和 fMRI 扩展到动态视频 EEG,并系统比较 100+ 个视频/视觉模型。
方法上,作者提出 Cross-Temporal RSA,用时间展开的模型特征去匹配不断演化的 EEG 响应,形成大规模动态对齐评测,而不是只问某个模型和脑活动总体相似不相似。
关键发现是,不同脑区和时间段偏好的模型能力不同:后部电极更贴近具有时间整合的中层动作特征,额叶更贴近高层静态动作表征,state-space/video temporal integration 和自监督预训练对部分后部活动更有利。
它值得正式收录,因为它提供了 AI 视频模型和人脑动态视觉处理之间的可复用评测接口,并把单一最佳模型的假设改写成动态 expert switching,这对视频模型架构、MoE/路由、时序表征学习和 NeuroAI 都有明确外溢。