智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-04-06
arXiv
2604.04901

收录解读

这篇论文针对个性化智能体长期记忆的一个具体缺口:现有记忆系统多依赖用户画像、对话摘要或叙事式 profile,但真实个人工作流往往沉淀在文件系统的操作痕迹、内容差异、目录结构、跨应用上下文和时间序列中。作者将这些低层行为轨迹视为可被智能体记忆系统利用的原始证据,提出用文件系统行为来支撑更稳健的个性化、意图恢复和长期上下文建模。

方法上,论文构建了 FileGramEngine、FileGramBench 和 FileGramOS 三个配套组件。FileGramEngine 用 persona 驱动的数据生成流程模拟真实文件工作流和多模态动作序列;FileGramBench 将评测拆成 profile reconstruction、trace disentanglement、persona drift detection、multimodal grounding 等任务;FileGramOS 则采用自底向上的记忆架构,把原子级文件动作、内容 delta 和时间上下文组织为程序性、语义性与情节性记忆通道,并在查询时进行抽象和检索。

它值得正式收录,是因为它把 agent memory 从对话摘要和向量检索推进到更接近操作系统层的行为证据建模,并给出了可复用的数据生成、评测和系统接口。对仓库关注的 agent memory、能力扩展和本地优先工具链而言,FileGram 的价值不只在一个 benchmark 分数,而在于提出了一种把文件系统事件流转化为个性化记忆的工程模式。

主要限制是证据仍然高度依赖合成轨迹和模拟 persona,真实个人文件系统会带来更强的隐私、权限、噪声、跨设备同步和分布漂移问题。FileGramOS 展示了比叙事式记忆更强的效果,但还不是大规模真实部署验证,因此更适合作为突破性 agent-memory 工作收录,而不是上调到 disruptive。

链接