多模态基础模型 突破级 暂无讲解视频
发表时间
2026-02-02
arXiv
2602.02002

收录解读

## 问题与背景 问题与背景:自动驾驶 world model 常被拆成多阶段系统,接口多、训练复杂、部署成本高。研究方向在持续往更统一的一体化 driving world model 收敛。

## 方法/新意 方法/新意:UniDriveDreamer 提出 single-stage multimodal world model,希望用一个更统一的系统同时处理驾驶中的多模态输入与未来状态生成,而不是多模块拼接。

## 意义/放在仓库中的位置 意义/放在仓库中的位置:它属于自动驾驶 / embodied world model 主线,和 Drive-JEPA、LaST-VLA、UniDWM 形成同方向的比较簇。

## 局限/为何不更高 局限/为何不更高:它是赛道内强代表作,但仍属于该方向竞争中的一员,尚不足以单独重排整条路线图,因此归为突破性。

链接