ImplicitMemBench: Measuring Unconscious Behavioral Adaptation in Large Language Models

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-04-09
arXiv: 2604.08064

收录解读

这篇论文指出当前 agent memory 评测过度聚焦显式事实回忆，例如多轮问答、状态跟踪或检索命中，而忽略了更接近长期助理需求的隐式记忆：经验是否会自动转化为程序化行为、偏好性反应或条件化规避，而不是在测试时被明确要求回忆。

ImplicitMemBench 将隐式记忆拆成三类认知构件：procedural memory、priming 和 classical conditioning，并统一成 Learning / Priming - Interfere - Test 协议。评测采用 first-attempt scoring，以避免模型通过显式推理、自我修正或提示回看掩盖自动化行为是否真正形成。

它值得收录，因为它为 agent memory 提供了一个新的评测维度：不是记住了什么事实，而是经验是否改变了后续默认行为。论文评测 17 个模型后显示没有模型超过 66% 总体表现，并揭示抑制式学习远弱于偏好式学习，这对后续设计 agent 记忆、技能固化和安全规避机制都有直接参考价值。

主要限制是 benchmark 规模只有 300 条，部分 priming 评测依赖 LLM judge，且它主要是诊断框架而非新的记忆架构。它能清晰指出当前模型的隐式记忆缺口，但还没有给出可部署的解决方案，因此定为突破而不是更高一级。

链接

论文链接