Generating Literature-Driven Scientific Theories at Scale

Peter Jansen; Peter Clark; Doug Downey; Daniel S. Weld

智能体与自主科学颠覆级暂无讲解视频

发表时间: 2026-01-22
arXiv: 2601.16282

收录解读

这篇论文把 AI for science 的目标从自动实验推进到自动理论生成：系统不是只总结论文，而是从大规模文献中抽取证据并合成带有 law、scope、evidence 的可测试理论。对于本仓库，它的重要性在于提出了一个可复用的 literature-to-theory workflow，而不只是一个文献综述工具。

Theorizer 的流程包括文献发现、结构化证据抽取、理论合成与自反思精炼，并用 13.7k 篇来源论文生成约 2.9k 条理论。论文还通过 backtesting 评估这些理论对后续论文结果的预测性，给出了比纯参数记忆生成更好的 specificity、empirical support 和 predictive accuracy。

它值得正式收录，是因为它明确提出了科学发现 agent 中尚未充分系统化的层级：从论文集合压缩出可检验理论。这种模式对 AI scientist、自动化科研工作流、文献驱动假设生成和理论审计都有外溢价值，且 Ai2 同时开放了代码和样例理论数据。

它没有升到 paradigm，是因为当前输出仍是 hypothesis 而非可靠科学定律，评估依赖 LLM-as-judge 和文献回测，领域覆盖也更适合 AI/NLP 这种开放论文密集场景。它是强范式候选，但仍需更多跨学科和人工实验验证。

链接

论文链接

收录解读

相关论文

链接