数学与形式推理 颠覆级 暂无讲解视频
发表时间
2026-02-09
arXiv
2602.08384

收录解读

- 分级:`颠覆性` - 正式标题:`Towards Real-World Industrial-Scale Verification: LLM-Driven Theorem Proving on seL4` - 原文:`2026-02-09-M3_AutoReal_seL4-Towards_Real_World_Industrial_Scale_Verification_LLM_Driven_Theorem_Proving_on_s.pdf` - 抽取:`extracted.md`

## 重写摘要

这篇论文最重要的一点,是把 LLM 驱动的证明从学术玩具 benchmark 推进到真实工业级形式化验证项目 seL4。作者提出 AutoReal,并基于该方法微调得到一个可本地部署的 7B 级证明器。系统结合了两类关键增强:一是 CoT 风格的证明训练,使模型不仅给 proof script,也学习步骤间的推理逻辑;二是上下文增强,把项目内部的证明背景显式注入模型。

论文在 seL4 重要理论集的 660 个定理上报告了 51.67% 的成功率。这个结果的意义不是“数字本身有多高”,而是它证明了本地、小模型、面向真实工程系统的证明器已经开始可用,而不再依赖超大闭源模型。

## 为什么重要

形式化验证能不能在工业里落地,关键不在 miniF2F,而在 seL4、协议、内核、编译器这类真实工程对象。AutoReal 属于把“数学能力”翻译成“工程工具”的关键过桥工作。

## 局限

需要继续确认它到底是推理能力提升,还是更强的上下文拼接和库风格拟合。真正的外部验证,必须看它在非 seL4 项目上的迁移表现。

链接