On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters

推理、记忆与推理时控制突破级暂无讲解视频

发表时间: 2026-06-01
arXiv: 2606.02437

核心要点

问题/背景: 这篇论文把 PEFT 从便宜微调手段提升为一种持久本地状态接口：共享大模型负责通用能力，小型 adapter 承载个人偏好、技能、工具习惯和记忆式更新。
方法/机制: 论文围绕 Scale Up、Scale Down、Scale Out 三个轴研究 adapter 如何随着基础模型变强、adapter 变小、实例数量变多而工作，并提出 MinT 作为 adapter 身份、版本、来源、评估和服务驻留的基础设施示例。
结果/证据: 它值得收录，因为它把 LoRA/adapter 与个人模型、agent memory、能力注入和模型服务基础设施连接起来，具有明显系统复用价值。
收录价值: 按当前收录规则，它属于近期值得正式跟踪的可复用方法或系统模式；但作为新近预印本，后续仍需要代码、复现和真实部署结果来确认长期影响。

完整收录解读

这篇论文把 PEFT 从便宜微调手段提升为一种持久本地状态接口：共享大模型负责通用能力，小型 adapter 承载个人偏好、技能、工具习惯和记忆式更新。

论文围绕 Scale Up、Scale Down、Scale Out 三个轴研究 adapter 如何随着基础模型变强、adapter 变小、实例数量变多而工作，并提出 MinT 作为 adapter 身份、版本、来源、评估和服务驻留的基础设施示例。

它值得收录，因为它把 LoRA/adapter 与个人模型、agent memory、能力注入和模型服务基础设施连接起来，具有明显系统复用价值。

按当前收录规则，它属于近期值得正式跟踪的可复用方法或系统模式；但作为新近预印本，后续仍需要代码、复现和真实部署结果来确认长期影响。

论文摘要

本文将 PEFT 适配器重新定义为共享基础模型之上的持久本地状态，研究了针对许多个性化适应实例的扩展、收缩和水平扩展等规模化策略。

英文原文

This paper reframes PEFT adapters as persistent local state on top of shared foundation models, studying scale-up, scale-down, and scale-out regimes for many personalized adapted instances.

链接

论文链接论文链接代码

核心要点

论文摘要

相关论文

链接