智能体与自主科学
突破级
暂无讲解视频
收录解读
WebXSkill 解决 Web agent 的长期痛点:已经完成过的流程不能稳定复用。它指出现有 skill 表示存在 grounding gap,纯文本技能无法执行,纯代码技能又不利于 agent 理解、恢复和泛化。
方法把一个 skill 表示成参数化 action program 加逐步自然语言说明,兼顾可执行性和可解释性。系统包含 skill extraction、URL graph 组织、retrieval,以及 grounded / guided 两种部署模式:强模型可以直接把技能当工具调用,弱模型可以按说明执行并保留局部自主性。
收录价值在于它给 agent capability extension 提供了具体、工程可落地的技能接口,而不是抽象记忆或普通 prompt reuse。跨 WebArena/WebVoyager 的迁移结果说明它有可能成为 Web agent 长程操作的可复用能力层。
主要限制是技能来自 synthetic trajectories,真实网页变化、权限边界、支付/账号等高风险操作还没有充分覆盖;此外 skill graph 的维护、冲突解决和安全审计仍需要更成熟机制。