收录解读
这篇论文处理的是 skill-enabled agent 系统的一个真实瓶颈:OpenClaw 这类 agent 可以安装和调用大量可复用 skill,但部署后的 skill 往往是静态资产。不同用户会在相似工具链、相似工作流和相似失败模式上反复踩坑,单次会话中发现的修复很少能沉淀成共享能力,导致系统层面的经验无法累积。
SkillClaw 的核心贡献是把 skill 更新从单用户局部修补推进到集体演化闭环。系统记录跨用户交互轨迹,包括 prompt、工具调用、环境反馈、错误和最终响应;再按引用的 skill 分组,形成带因果链的共享证据库;agentic evolver 对成功和失败轨迹做开放式诊断,选择 refine、create 或 skip,并把候选 skill 更新经真实环境验证后同步回共享 skill repository。
它值得正式收录,因为它直接命中仓库的 agent memory、capability acquisition 和 skill systems 主线。相比已有的单 agent skill discovery 或本地 trace repair,SkillClaw 明确提出了多用户 skill ecosystem 的演化机制:普通使用产生证据,夜间 evolver 生成更新,validator 过滤后全局分发。这是一个有工程可复用性的系统模式,也为 agent skill marketplace 如何持续改进提供了清晰蓝图。
它目前仍只是 breakthrough,而不是更高一级。论文标注为 work in progress,实验是 8 个模拟用户、6 轮 day-night evolution、WildClawBench 中 4 类任务,并且主要由 Qwen3-Max 同时承担执行、演化和验证。结果显示社交、检索、创意和安全任务均有提升,但跨平台可迁移性、真实多用户部署中的噪声、恶意轨迹污染、验证成本和版本治理仍缺少充分证据。