智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-05-13
arXiv
2605.13880

收录解读

Preping 研究 pre-task memory construction:agent 在看到目标任务之前,仅凭环境文档和可执行工具,通过自生成练习构建 procedural memory。

系统引入 proposer memory 作为控制状态,由 Proposer 生成 synthetic tasks,Solver 执行,Validator 决定哪些轨迹可写入 memory 并反馈下一轮 proposal,避免练习冗余、不可行和低信息量。

它值得正式收录,因为它把 agent memory 从事后日志总结推进到部署前自练习和选择性记忆构建,对 MCP/tool agents 的冷启动有直接工程价值。

它没有更高,是因为生成练习的覆盖性和 Validator 可靠性仍依赖环境类型;复杂真实任务分布下的负迁移需要更多验证。

链接