推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
delta-mem: Efficient Online Memory for Large Language Models 关注的是一个可复用的 AI 系统或评测问题,而不是单点 demo。
Compact online associative memory state coupled to frozen attention for LLM long-term memory.
It is a direct memory primitive for LLM/agent systems, using a compact online state to modify attention without full fine-tuning or context extension.
它没有更高,是因为这些新 arXiv 工作仍需要更多独立复现、真实系统部署和长期社区采用来确认影响。