智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-05-11
arXiv
2605.10332

核心要点

问题/背景
这篇论文把 self-evolving skills 从数字环境推进到 embodied agents。具身环境的失败并不总是技能内容错了,也可能是 agent 没有执行好本来正确的指导。
方法/机制
EmbodiSkill 的核心是 skill-aware reflection:每条轨迹都相对于当前 skill 解释,区分 skill-changing evidence 和 execution-lapse evidence。前者用于修改技能主体,后者用于保留并强调已有有效指导。
结果/证据
这种区分很关键,因为直接把失败轨迹粗暴蒸馏成技能更新,会把执行失误错误地写进技能,导致长期技能污染。
收录价值
收录价值在于它提出了 embodied skill self-evolution 的具体诊断边界,让技能更新从“失败就改”变成“判断是技能错还是执行错再改”。
完整收录解读

这篇论文把 self-evolving skills 从数字环境推进到 embodied agents。具身环境的失败并不总是技能内容错了,也可能是 agent 没有执行好本来正确的指导。

EmbodiSkill 的核心是 skill-aware reflection:每条轨迹都相对于当前 skill 解释,区分 skill-changing evidence 和 execution-lapse evidence。前者用于修改技能主体,后者用于保留并强调已有有效指导。

这种区分很关键,因为直接把失败轨迹粗暴蒸馏成技能更新,会把执行失误错误地写进技能,导致长期技能污染。

收录价值在于它提出了 embodied skill self-evolution 的具体诊断边界,让技能更新从“失败就改”变成“判断是技能错还是执行错再改”。

论文摘要

EmbodiSkill 是一种无需训练的身体技能自进化框架。它将任务轨迹与当前技能进行解释,将技能改变证据与执行失效证据分离,仅在轨迹指示无效或不完整指导时修改技能身体,并在失败是由于执行失效造成的时保留/强调有效指导。

英文原文

EmbodiSkill is a training-free framework for embodied skill self-evolution. It interprets task trajectories with respect to the current skill, separates skill-changing evidence from execution-lapse evidence, revises the skill body only when the trajectory indicates invalid or incomplete guidance, and preserves/emphasizes valid guidance when failures are due to execution lapses.

相关论文

链接