Solving Physics Olympiad via Reinforcement Learning on Physics Simulators
这篇论文针对科学推理训练数据稀缺问题:数学和代码有大量可验证题目,但物理等科学领域缺少大规模 QA 数据。作者提出用物理模拟器生成随机场景、交互和问答,把 simulator 变成可验证监督源,用 RL 训练模型进行物理推理。 方法上,系统在 physics engines 中生成合成交互,构造问题和答案,再用...
这篇论文针对科学推理训练数据稀缺问题:数学和代码有大量可验证题目,但物理等科学领域缺少大规模 QA 数据。作者提出用物理模拟器生成随机场景、交互和问答,把 simulator 变成可验证监督源,用 RL 训练模型进行物理推理。 方法上,系统在 physics engines 中生成合成交互,构造问题和答案,再用...
这篇论文属于 AI for atomistic modeling 方向,目标是提升 SE(3)-equivariant graph attention transformer 在大规模材料、分子和势能面建模中的效率、表达力与物理一致性。随着等变 GNN 成为 3D 原子系统建模的核心工具,速度、可扩展性和高阶导...