Brain-Semantoks: Learning Semantic Tokens of Brain Dynamics with a Self-Distilled Foundation Model

神经科学与认知科学突破级有讲解视频

发表时间: 2026-03-02
arXiv: 2512.11582

收录解读

这篇论文针对 fMRI foundation model 的一个核心错位提出了修正：现有很多方法仍围绕 masked reconstruction 或局部区域重建来训练，因此更容易学到对噪声和时间波动敏感的低层表示，而不是适合认知与疾病表型预测的稳定脑动态表征。作者把目标从‘重建信号’改成了‘提取抽象而稳定的脑动态语义’。

方法上的关键有两点。第一是 semantic tokenizer，它不再把小脑区时间序列直接当 token，而是按功能网络把 noisy regional signals 聚合成语义更强、噪声更低的 token。第二是 self-distillation across time，通过 teacher-student 框架强制不同时间视图对齐，再配合 Teacher-guided Temporal Regularizer 作为训练课程，避免在低信噪比 fMRI 上塌缩到无意义解。

它适合进入仓库，因为这是一篇明确的 brain foundation model 条目，而且 AI 外溢并不只是应用层。论文在输入 token 设计、自监督目标、跨时间稳定表示和 scaling 分析上都给出了清晰路线，对低信噪比时序数据的 foundation modeling、语义 token 化和自蒸馏表示学习都有直接启发。线性探针下的强表现也说明表征确实更接近通用、可迁移的脑动态语义空间。

它没有更高一级，因为影响范围目前仍集中在 fMRI foundation modeling 和 neuroimaging transfer，而不是更普遍地改写跨模态 foundation model 主线。更准确地说，这是一篇很强的 NeuroAI/brain representation 论文，足够正式收录，但还没有到范式级别。

解读视频

B 站 YouTube

链接

论文链接