智能体与自主科学
突破级
暂无讲解视频
收录解读
Preping 研究 pre-task memory construction:agent 在看到目标任务之前,仅凭环境文档和可执行工具,通过自生成练习构建 procedural memory。
系统引入 proposer memory 作为控制状态,由 Proposer 生成 synthetic tasks,Solver 执行,Validator 决定哪些轨迹可写入 memory 并反馈下一轮 proposal,避免练习冗余、不可行和低信息量。
它值得正式收录,因为它把 agent memory 从事后日志总结推进到部署前自练习和选择性记忆构建,对 MCP/tool agents 的冷启动有直接工程价值。
它没有更高,是因为生成练习的覆盖性和 Validator 可靠性仍依赖环境类型;复杂真实任务分布下的负迁移需要更多验证。