Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning

智能体与自主科学突破级暂无讲解视频

收录解读

Spreadsheet-RL 把 spreadsheet agent 从 prompt-only 操作推进到真实 Excel 环境中的多轮 RL 训练，目标是处理复杂、多步骤、接近日常工作流的数据任务。

系统包含自动收集 start-goal spreadsheets 的 pipeline、Domain-Spreadsheet benchmark，以及暴露大量 Excel 功能的 Spreadsheet Gym；agent 通过 Python sandbox 和工具路由规则执行任务。

实验显示 RL fine-tuning 能显著提升 Qwen3-4B-Thinking-2507 在 SpreadsheetBench 和 Domain-Spreadsheet 上的 Pass@1，说明专门环境训练比单纯提示更适合这类工具密集型界面任务。

它值得正式收录，因为 spreadsheet 是高频现实工作界面，论文提供了环境、数据、benchmark 和训练流程，能作为 GUI/data-interface agent 的可复用工作流模板。