生成建模与扩散 突破级 有讲解视频
发表时间
2026-05-22
arXiv
2605.23345

收录解读

SCOPE 处理 FPS playable world models 的控制难题:高频、重叠的控制信号会同时影响局部武器区域和全局相机/移动,普通全局 action injection 容易干扰无关区域。

论文观察到 FPS actions 具有空间选择性,离散动作如开火和换弹主要影响 weapon scope,连续相机和移动则控制周围环境。

方法在 pretrained video diffusion model 的每个 transformer block 中插入 conditioning module,把特征重排为 per-pixel temporal sequences,让每个位置按局部视觉内容计算 action response;同时发布 CrossFPS 多游戏数据集。

它值得正式收录,因为它为可玩世界模型提供了局部动作响应和跨游戏泛化接口,对游戏 world model、交互仿真和 embodied environment generation 有复用价值。

解读视频

链接