科学发现旗舰工作
颠覆级
暂无讲解视频
收录解读
ERA 针对科学研究中的一个真实瓶颈:研究软件和实验脚本往往需要专家长期手写,限制了计算实验迭代速度。
系统把 LLM 与 tree search 结合,以质量指标为目标反复生成、测试和改进代码;论文报告它在单细胞分析、COVID-19 住院预测、地理空间分析、斑马鱼神经活动预测和数值积分等任务中达到或超过专家级结果。
它值得正式收录,因为它不是普通 coding agent,而是把代码生成、外部研究思想整合和 empirical objective search 变成科学软件发现器,直接改变计算科学 workflow。
它没有更高,是因为任务仍围绕可度量 leaderboard 或明确指标;开放式科研问题、不可形式化目标和长期维护质量仍需验证。