智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-05-21
arXiv
2605.22642

收录解读

Spreadsheet-RL 把 spreadsheet agent 从 prompt-only 操作推进到真实 Excel 环境中的多轮 RL 训练,目标是处理复杂、多步骤、接近日常工作流的数据任务。

系统包含自动收集 start-goal spreadsheets 的 pipeline、Domain-Spreadsheet benchmark,以及暴露大量 Excel 功能的 Spreadsheet Gym;agent 通过 Python sandbox 和工具路由规则执行任务。

实验显示 RL fine-tuning 能显著提升 Qwen3-4B-Thinking-2507 在 SpreadsheetBench 和 Domain-Spreadsheet 上的 Pass@1,说明专门环境训练比单纯提示更适合这类工具密集型界面任务。

它值得正式收录,因为 spreadsheet 是高频现实工作界面,论文提供了环境、数据、benchmark 和训练流程,能作为 GUI/data-interface agent 的可复用工作流模板。

链接