收录解读
这篇论文针对 fMRI foundation model 的一个核心错位提出了修正:现有很多方法仍围绕 masked reconstruction 或局部区域重建来训练,因此更容易学到对噪声和时间波动敏感的低层表示,而不是适合认知与疾病表型预测的稳定脑动态表征。作者把目标从‘重建信号’改成了‘提取抽象而稳定的脑动态语义’。
方法上的关键有两点。第一是 semantic tokenizer,它不再把小脑区时间序列直接当 token,而是按功能网络把 noisy regional signals 聚合成语义更强、噪声更低的 token。第二是 self-distillation across time,通过 teacher-student 框架强制不同时间视图对齐,再配合 Teacher-guided Temporal Regularizer 作为训练课程,避免在低信噪比 fMRI 上塌缩到无意义解。
它适合进入仓库,因为这是一篇明确的 brain foundation model 条目,而且 AI 外溢并不只是应用层。论文在输入 token 设计、自监督目标、跨时间稳定表示和 scaling 分析上都给出了清晰路线,对低信噪比时序数据的 foundation modeling、语义 token 化和自蒸馏表示学习都有直接启发。线性探针下的强表现也说明表征确实更接近通用、可迁移的脑动态语义空间。
它没有更高一级,因为影响范围目前仍集中在 fMRI foundation modeling 和 neuroimaging transfer,而不是更普遍地改写跨模态 foundation model 主线。更准确地说,这是一篇很强的 NeuroAI/brain representation 论文,足够正式收录,但还没有到范式级别。