神经科学与认知科学 突破级 暂无讲解视频
发表时间
2026-05-28
arXiv
2605.29591

核心要点

问题/背景
这篇论文针对脑-视觉-语言建模的碎片化问题:现有模型通常为单一编码或解码任务定制,难以复用任务间共享的脑表征。
方法/机制
Mind-Omni 提出 Brain Tokenizer,把连续异构脑信号离散化为统一 token,再通过 discrete diffusion 支持多种脑-视觉-语言任务,并构建 Brain Question Answering 指令数据来激活更强的语义推理。
结果/证据
它值得收录,因为它把脑信号处理显式推向 tokenized multimodal foundation-model 接口,这对未来脑机接口、脑解码和多模态表征学习都有系统化价值。
收录价值
按当前收录规则,它是高潜力预印本而非已定论突破;模型规模、跨数据集泛化、脑信号类型覆盖和真实 BCI 部署仍需验证。
完整收录解读

这篇论文针对脑-视觉-语言建模的碎片化问题:现有模型通常为单一编码或解码任务定制,难以复用任务间共享的脑表征。

Mind-Omni 提出 Brain Tokenizer,把连续异构脑信号离散化为统一 token,再通过 discrete diffusion 支持多种脑-视觉-语言任务,并构建 Brain Question Answering 指令数据来激活更强的语义推理。

它值得收录,因为它把脑信号处理显式推向 tokenized multimodal foundation-model 接口,这对未来脑机接口、脑解码和多模态表征学习都有系统化价值。

按当前收录规则,它是高潜力预印本而非已定论突破;模型规模、跨数据集泛化、脑信号类型覆盖和真实 BCI 部署仍需验证。

论文摘要

Mind-Omni 通过一个离散扩散框架统一了多种脑编码和解码任务,利用一个脑分词器将异质脑信号转换为离散标记,并支持脑-视觉-语言生成和推理任务。

英文原文

Mind-Omni unifies multiple brain encoding and decoding tasks through a discrete diffusion framework, using a Brain Tokenizer to convert heterogeneous brain signals into discrete tokens and support brain-vision-language generation and reasoning tasks.

相关论文

链接