多模态基础模型 突破级 暂无讲解视频
发表时间
2026-04-15
arXiv
2604.14144

收录解读

问题与背景:3D spatial reasoning 对具身智能很关键,但人工几何标注昂贵;普通 self-evolution 又容易用模型共识制造伪标签,强化自身错误。

方法与新意:SpatialEvo 利用 3D 几何的确定性:给定点云和相机位姿,很多空间问题的答案可以由规则精确计算。DGE 把 16 类空间任务变成零噪声交互 oracle,并让共享参数 policy 在 questioner/solver 角色中共同进化。

收录意义:这篇对 embodied/spatial intelligence 有明显复用价值,因为它把自进化从“模型互相投票”改成“物理几何环境提供客观反馈”。这种 deterministic environment 思路可能迁移到机器人、3D agent 和具身评测。

局限:DGE 覆盖的是可由几何规则验证的空间任务,离真实机器人任务中的感知噪声、物体动力学和开放语义仍有距离。

链接