Dex4D: Task-Agnostic Point Track Policy for Sim-to-Real Dexterous Manipulation

机器人与具身智能突破级暂无讲解视频

发表时间: 2026-06-01
arXiv: 2602.15828

核心要点

问题/背景: 这篇论文/项目对应最近追查到的线索：完全在仿真中学习任务无关的 3D point-track dexterous policy，几小时级并行仿真训练构成方法基础，部署时不需要真实机器人数据或策略微调。
方法/机制: 核心方法是 Anypose-to-Anypose：把灵巧操作抽象为把任意物体从当前 3D 位姿转换到目标 3D 位姿，策略条件化在当前/目标对象点轨迹上，而不是为每个任务手写 reward、grasp 或 motion primitive。
结果/证据: 它值得补收入库，因为它把视频生成/4D 重建产生的目标点轨迹、实时点跟踪和 sim-to-real dexterous policy 连接成一个可复用框架，直接服务机器人泛化、3D 表征控制和零样本迁移。
收录价值: 按当前规则，它属于 robotics/embodied intelligence 的 breakthrough；但它仍是预印本/ICRA workshop 版本，真实任务覆盖和跨硬件规模化还需要更多独立复现。

完整收录解读

这篇论文/项目对应最近追查到的线索：完全在仿真中学习任务无关的 3D point-track dexterous policy，几小时级并行仿真训练构成方法基础，部署时不需要真实机器人数据或策略微调。

核心方法是 Anypose-to-Anypose：把灵巧操作抽象为把任意物体从当前 3D 位姿转换到目标 3D 位姿，策略条件化在当前/目标对象点轨迹上，而不是为每个任务手写 reward、grasp 或 motion primitive。

它值得补收入库，因为它把视频生成/4D 重建产生的目标点轨迹、实时点跟踪和 sim-to-real dexterous policy 连接成一个可复用框架，直接服务机器人泛化、3D 表征控制和零样本迁移。

按当前规则，它属于 robotics/embodied intelligence 的 breakthrough；但它仍是预印本/ICRA workshop 版本，真实任务覆盖和跨硬件规模化还需要更多独立复现。

原始摘要与中文对照

中文对照翻译

Dex4D学习一个领域无关的、3D点轨迹条件化的任意姿态到任意姿态策略，该策略在模拟中针对数千个物体进行训练，然后将其零样本部署到真实的灵巧操作任务中，使用从生成的视频或其他来源中提取的以物体为中心的点轨迹。

原始摘要

Dex4D learns a domain-agnostic 3D point-track-conditioned Anypose-to-Anypose policy in simulation over thousands of objects, then deploys it zero-shot to real dexterous manipulation tasks using object-centric point tracks extracted from generated videos or other sources.

链接

论文链接论文链接论文链接项目代码

核心要点

原始摘要与中文对照

中文对照翻译

原始摘要

相关论文

链接