智能体与自主科学
突破级
暂无讲解视频
收录解读
LITMUS: Benchmarking Behavioral Jailbreaks of LLM Agents in Real OS Environments 关注的是一个可复用的 AI 系统或评测问题,而不是单点 demo。
OS-level benchmark for behavior jailbreaks in autonomous agents.
It evaluates physical/action-layer harm with rollback and dual semantic-physical verification, a strong reusable safety benchmark.
它没有更高,是因为这些新 arXiv 工作仍需要更多独立复现、真实系统部署和长期社区采用来确认影响。