对应论文

Geometry-Aware Implicit Memory for Video World Models

视频简介

Video world models 的长程 rollout 依赖模型在观察离开上下文窗口后还能保留场景结构。 GIM-World 用 geometry-aware implicit memory 压缩历史状态,并显式约束跨视角几何,而不是保存帧或依赖启发式 3D 重建。 它值得收录,因为 world model memory 正成为交互式视频生成和 embodied simulation 的核心瓶颈。 按当前收录规则,它属于近期值得正式跟踪的可复用方法或系统模式;但作为新近预印本,后续仍需要代码、复现和真实部署结果来确认长期影响。

外部视频链接

论文链接