对应论文
Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems
视频简介
这篇论文提出 agent lifespan engineering:部署中的 agent 即使权重冻结,其记忆库、压缩历史、事实修订和维护操作都会让系统状态持续变化。 AgingBench 把退化机制分成 compression aging、interference aging、revision aging 和 maintenance aging,并用 temporal dependency graphs 与 paired counterfactual probes 定位 write/retrieval/utilization 阶段的问题。 核心贡献不是又一个静态 benchmark,而是把 agent 可靠性定义为生命周期属性,要求评估系统在长期交互和维护后的退化形态。 收录价值在于它为长期 agent memory/retrieval 系统提供了诊断语言和评测接口,正中本库 agent memory 与部署可靠性重点。