推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
MemLens 针对多模态长期记忆提出系统评测:问题来自多轮、多 session 对话,并明确要求模型利用图像证据、时间顺序、知识更新和拒答能力。
论文关键价值在于把 long-context LVLM 和 memory-augmented agents 放在同一评测接口下比较。结果显示长上下文模型短上下文表现好但随长度退化,记忆 agent 更稳定却容易损失视觉细节。
它值得正式收录,因为 agent memory 正在从文本检索转向多模态长期交互,MemLens 给出了可复用的能力拆分和跨架构对比基准。
它没有更高,是因为它仍是 benchmark;对真实个人助理、机器人和持续学习系统的工程闭环还需要后续系统验证。