生成建模与扩散 突破级 暂无讲解视频
发表时间
2026-05-15
arXiv
2605.15843

收录解读

WorldAct 针对当前 3D world generation 的重要缺口:生成世界往往是静态 monolithic asset,难以编辑、碰撞、操作或用于 embodied simulation。

它用 multimodal agent 指导场景分解、识别可行动对象、重建几何对齐的 object-level meshes,并用 3D inpainting 恢复背景。

它值得正式收录,因为 world generation 要服务机器人和交互式内容,必须从可观看场景转向可编辑、可操作、可执行的 object-centric worlds。

它没有更高,是因为交互物理真实性、复杂任务执行和与真实机器人策略的结合还需要后续验证。

链接