推理、记忆与推理时控制
突破级
暂无讲解视频
核心要点
- 问题/背景
- 这篇论文把 PEFT 从便宜微调手段提升为一种持久本地状态接口:共享大模型负责通用能力,小型 adapter 承载个人偏好、技能、工具习惯和记忆式更新。
- 方法/机制
- 论文围绕 Scale Up、Scale Down、Scale Out 三个轴研究 adapter 如何随着基础模型变强、adapter 变小、实例数量变多而工作,并提出 MinT 作为 adapter 身份、版本、来源、评估和服务驻留的基础设施示例。
- 结果/证据
- 它值得收录,因为它把 LoRA/adapter 与个人模型、agent memory、能力注入和模型服务基础设施连接起来,具有明显系统复用价值。
- 收录价值
- 按当前收录规则,它属于近期值得正式跟踪的可复用方法或系统模式;但作为新近预印本,后续仍需要代码、复现和真实部署结果来确认长期影响。
论文摘要
本文将 PEFT 适配器重新定义为共享基础模型之上的持久本地状态,研究了针对许多个性化适应实例的扩展、收缩和水平扩展等规模化策略。
英文原文
This paper reframes PEFT adapters as persistent local state on top of shared foundation models, studying scale-up, scale-down, and scale-out regimes for many personalized adapted instances.