Mind-Omni: A Unified Multi-Task Framework for Brain-Vision-Language Modeling via Discrete Diffusion

神经科学与认知科学突破级暂无讲解视频

发表时间: 2026-05-28
arXiv: 2605.29591

核心要点

问题/背景: 这篇论文针对脑-视觉-语言建模的碎片化问题：现有模型通常为单一编码或解码任务定制，难以复用任务间共享的脑表征。
方法/机制: Mind-Omni 提出 Brain Tokenizer，把连续异构脑信号离散化为统一 token，再通过 discrete diffusion 支持多种脑-视觉-语言任务，并构建 Brain Question Answering 指令数据来激活更强的语义推理。
结果/证据: 它值得收录，因为它把脑信号处理显式推向 tokenized multimodal foundation-model 接口，这对未来脑机接口、脑解码和多模态表征学习都有系统化价值。
收录价值: 按当前收录规则，它是高潜力预印本而非已定论突破；模型规模、跨数据集泛化、脑信号类型覆盖和真实 BCI 部署仍需验证。

完整收录解读

这篇论文针对脑-视觉-语言建模的碎片化问题：现有模型通常为单一编码或解码任务定制，难以复用任务间共享的脑表征。

Mind-Omni 提出 Brain Tokenizer，把连续异构脑信号离散化为统一 token，再通过 discrete diffusion 支持多种脑-视觉-语言任务，并构建 Brain Question Answering 指令数据来激活更强的语义推理。

它值得收录，因为它把脑信号处理显式推向 tokenized multimodal foundation-model 接口，这对未来脑机接口、脑解码和多模态表征学习都有系统化价值。

按当前收录规则，它是高潜力预印本而非已定论突破；模型规模、跨数据集泛化、脑信号类型覆盖和真实 BCI 部署仍需验证。

论文摘要

Mind-Omni 通过一个离散扩散框架统一了多种脑编码和解码任务，利用一个脑分词器将异质脑信号转换为离散标记，并支持脑-视觉-语言生成和推理任务。

英文原文

Mind-Omni unifies multiple brain encoding and decoding tasks through a discrete diffusion framework, using a Brain Tokenizer to convert heterogeneous brain signals into discrete tokens and support brain-vision-language generation and reasoning tasks.

链接

论文链接论文链接

核心要点

论文摘要

相关论文

链接