全部论文索引，第 2 页

A scalable and generic framework for city-wide traffic prediction with large language model

发表：2026-05-26 · 收录：未知 · 能源、水与基础设施

这篇 Nature Communications 论文提出 LLM-UTP，把城市级交通预测从单一模式、单一场景和固定时间粒度的任务模型，推进到可跨城市、跨交通方式、跨场景复用的大模型式预测框架。系统由趋势数据增强、时空特征编码和 LLM 模块组成，目标是同时捕捉不同交通模式中的通用趋势和特定波动，形成面向城...

VitaBench 2.0: Evaluating Personalized and Proactive Agents in Long-Term User Interactions

发表：2026-05-26 · 收录：未知 · 智能体与自主科学

这篇论文补齐现有 agent benchmark 的盲区：多数 benchmark 测 reasoning/tool use，但很少测长期用户交互中的个性化建模和主动补全信息。 VitaBench 2.0 把任务组织成个人用户的时间序列，偏好分散在碎片化互动中，agent 必须持续抽取、更新和使用这些偏好。它...

D^2-Monitor: Dynamic Safety Monitoring for Diffusion LLMs via Hesitation-Aware Routing

发表：2026-05-25 · 收录：未知 · 安全、治理与可靠性

这篇论文处理 diffusion LLM 的新安全问题：D-LLM 通过多步 denoising 生成文本，暴露出 autoregressive LLM 没有的中间轨迹信号。作者发现最有用的失败预测信号是 safety hesitation，即中间隐藏状态反复落在轻量安全 probe 的决策边界附近。 D^2...

ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence

发表：2026-05-25 · 收录：未知 · 科学发现旗舰工作

这篇论文抓住 autonomous research agents 的核心短板：自动生成论文表面完整，但引用、分数、代码实现和方法描述可能不可验证。 Chain-of-Evidence 要求每个 claim 绑定证据来源，ScientistOne 在文献综述、方案发现和写作过程中持续维护证据链。 CoE Aud...

DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning

发表：2026-05-25 · 收录：未知 · 强化学习

DVAO 关注多奖励 RL 后训练的核心问题：真实模型优化常同时包含正确性、格式、偏好、安全或效率等多个奖励，静态权重容易让高方差奖励支配训练。论文提出 dynamic variance-adaptive advantage optimization，根据不同 reward stream 的方差和训练状态动态...

Language Models Need Sleep

发表：2026-05-25 · 收录：未知 · 推理、记忆与推理时控制

这篇论文把长上下文处理重新表述为 sleep-like consolidation：模型不必无限增长 KV cache，而是周期性把近期上下文压入可持续状态。方法在 sleep 阶段对累积上下文做离线 recurrent passes，并通过 learned local rule 更新 SSM blocks...

WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation

发表：2026-05-25 · 收录：未知 · 生成建模与扩散

WBench 针对 interactive video/world models 的评估缺口：现有 benchmark 往往只覆盖静态视频质量、单轮生成或局部交互能力，缺少系统化多轮世界评测。它构建 289 个 test cases 和 1,058 个 interaction turns，每个样例包含世界设定...

Hierarchical Multi-agent Large Language Model Reasoning for Autonomous Heterogeneous Catalyst Discovery

发表：2026-05-25 · 收录：未知 · 化学、生物与自动化实验室

这篇 npj Computational Materials 论文把 LLM agents 用到异相催化发现，而不是只做文献问答或自动脚本执行。 MASTER 将自然语言推理、multi-agent collaboration 和 density functional theory workflows 连接起来...

SOFisher: reinforcement learning-guided experiment designs for spatial omics

发表：2026-05-25 · 收录：未知 · 化学、生物与自动化实验室

SOFisher 针对空间组学实验设计的现实瓶颈：研究者需要决定测什么 target 和在哪里放置 FOV，密集采样再拼接成本高、耗时长，有时甚至不可行。论文提出 reinforcement learning framework，根据已经采样的 FOV 序列选择下一个 FOV 位置，以更少采样捕获更多 reg...

A large-scale unified deep learning model for peptide mass spectrum interpretation trained on multimodal data

发表：2026-05-25 · 收录：未知 · 化学、生物与自动化实验室

这篇 Nature Machine Intelligence 论文把质谱蛋白质组解析从多个分散工具推进到统一的 multimodal foundational model。 pUniFind 在超过 100 million open search-derived spectra 上训练，通过 spectral...

De novo design of DNA origami with a generative diffusion model

发表：2026-05-25 · 收录：未知 · 化学、生物与自动化实验室

这篇论文把蛋白工程中已成熟的 generative inverse design 思路扩展到 DNA origami，用于探索更复杂几何和功能的 DNA 纳米结构设计空间。作者为缺少大规模标准结构数据的问题设计了基于 multiscale computational model 的模拟平衡构象训练数据，并用...