智能体与自主科学
突破级
暂无讲解视频
核心要点
- 问题/背景
- 这篇论文把 self-evolving skills 从数字环境推进到 embodied agents。具身环境的失败并不总是技能内容错了,也可能是 agent 没有执行好本来正确的指导。
- 方法/机制
- EmbodiSkill 的核心是 skill-aware reflection:每条轨迹都相对于当前 skill 解释,区分 skill-changing evidence 和 execution-lapse evidence。前者用于修改技能主体,后者用于保留并强调已有有效指导。
- 结果/证据
- 这种区分很关键,因为直接把失败轨迹粗暴蒸馏成技能更新,会把执行失误错误地写进技能,导致长期技能污染。
- 收录价值
- 收录价值在于它提出了 embodied skill self-evolution 的具体诊断边界,让技能更新从“失败就改”变成“判断是技能错还是执行错再改”。
论文摘要
EmbodiSkill 是一种无需训练的身体技能自进化框架。它将任务轨迹与当前技能进行解释,将技能改变证据与执行失效证据分离,仅在轨迹指示无效或不完整指导时修改技能身体,并在失败是由于执行失效造成的时保留/强调有效指导。
英文原文
EmbodiSkill is a training-free framework for embodied skill self-evolution. It interprets task trajectories with respect to the current skill, separates skill-changing evidence from execution-lapse evidence, revises the skill body only when the trajectory indicates invalid or incomplete guidance, and preserves/emphasizes valid guidance when failures are due to execution lapses.