Multimodal And Generative Systems 突破级 暂无讲解视频
发表时间
2026-06-10
arXiv
2606.09967

核心要点

问题/背景
ABot-Earth 0.5 解决的是大范围真实 3D 仿真环境生成问题:从普遍可得的卫星图像出发,生成可交互的城市级 3D 场景,而不是依赖人工建模或封闭高成本地图资产。
方法/机制
论文把生成模型直接建立在 3D Gaussian Splatting 表示上,并在真实城市重建语料上训练,使推理时可仅由 geospatially referenced satellite imagery 条件生成大尺度 3D 环境。摘要报告生成速度低于每平方公里 10 分钟,并支持层级 LOD 的网页实时可视化。
结果/证据
正式收录价值在于它把 Earth observation、3D generation 和 embodied AI simulation 连接起来,为 UAV navigation、机器人仿真、城市数字孪生和 sim-to-real 数据生成提供可复用世界生成接口。
收录价值
它不是更高一级,因为仍是 arXiv 技术报告,真实物理交互、语义可控性和下游迁移效果需要更多验证;但作为卫星到 3D 世界模型的生成式框架,具备突破性。
完整收录解读

ABot-Earth 0.5 解决的是大范围真实 3D 仿真环境生成问题:从普遍可得的卫星图像出发,生成可交互的城市级 3D 场景,而不是依赖人工建模或封闭高成本地图资产。

论文把生成模型直接建立在 3D Gaussian Splatting 表示上,并在真实城市重建语料上训练,使推理时可仅由 geospatially referenced satellite imagery 条件生成大尺度 3D 环境。摘要报告生成速度低于每平方公里 10 分钟,并支持层级 LOD 的网页实时可视化。

正式收录价值在于它把 Earth observation、3D generation 和 embodied AI simulation 连接起来,为 UAV navigation、机器人仿真、城市数字孪生和 sim-to-real 数据生成提供可复用世界生成接口。

它不是更高一级,因为仍是 arXiv 技术报告,真实物理交互、语义可控性和下游迁移效果需要更多验证;但作为卫星到 3D 世界模型的生成式框架,具备突破性。

原始摘要与中文对照

中文对照翻译

我们提出了 ABot-Earth 0.5,一个生成式3D框架,旨在从无处不在的、地理空间参考的卫星图像中合成广阔、无缝的3D环境。为此,我们提出了一种新颖的生成模型,直接采用3D高斯泼溅(3DGS)表示进行构建。该模型在多样化的现有真实世界城市重建语料库上进行训练,学习生成逼真的几何形状和纹理。在推理时,它仅根据卫星图像合成新颖的3D场景,以每平方公里不到10分钟的可扩展速度,同时展现出卓越的真实感。该框架设计注重可访问性,集成了分层细节级别(LOD)结构,允许在基于网络的地图引擎上进行实时、交互式可视化。这个高保真模拟沙盒有效地弥合了模拟到现实的领域鸿沟,从而支持关键的下游具身AI应用,例如闭环无人机导航。通过提供超低成本和高效率的解决方案,ABot-Earth 0.5 显著降低了大规模3D重建的技术和财务门槛,并赋能全球数字地球可视化的未来。官方页面:http://abot-earth.amap.com/

原始摘要

We present ABot-Earth 0.5 , a generative 3D framework designed to synthesize vast, seamless 3D environments from ubiquitous, geospatially referenced satellite imagery. To achieve this, we propose a novel generative model formulated directly with the 3D Gaussian Splatting (3DGS) representation. The model is trained on a diverse corpus of existing real-world urban reconstructions, learning to generate realistic geometry and textures. At inference, it synthesizes novel 3D scenes conditioned solely on satellite imagery at a scalable rate of under 10 minutes per square kilometer, while demonstrating exceptional realism. The framework is designed for accessibility, with integrated hierarchical level-of-detail (LOD) structures that permit real-time, interactive visualization on web-based map engines. This high-fidelity simulation sandbox effectively mitigates the sim-toreal domain gap, enabling critical downstream Embodied AI applications like closed-loop UAV navigation. By providing an ultra-low-cost and high-efficiency solution, ABot-Earth 0.5 significantly lowers the technical and financial barriers to large-scale 3D reconstruction and empowers the future of global digital earth visualization. Official Page: http://abot-earth.amap.com/

相关论文

链接