WorldAct: Activating Monolithic 3D Worlds into Interactive-Ready Object-Centric Scenes

生成建模与扩散突破级暂无讲解视频

收录解读

WorldAct 针对当前 3D world generation 的重要缺口：生成世界往往是静态 monolithic asset，难以编辑、碰撞、操作或用于 embodied simulation。

它用 multimodal agent 指导场景分解、识别可行动对象、重建几何对齐的 object-level meshes，并用 3D inpainting 恢复背景。

它值得正式收录，因为 world generation 要服务机器人和交互式内容，必须从可观看场景转向可编辑、可操作、可执行的 object-centric worlds。

它没有更高，是因为交互物理真实性、复杂任务执行和与真实机器人策略的结合还需要后续验证。