科学发现旗舰工作 突破级 暂无讲解视频
发表时间
2026-03-02
arXiv
2603.01499

收录解读

云端 LLM 推理把能力交给了大模型服务,但也把用户输入与输出暴露给远端系统,这使真正可用的 privacy-preserving inference 一直卡在一个很现实的工程约束上:不能只讲安全,还要同时保证大模型精度、工业级吞吐,以及和现有 serving 基础设施的兼容性。很多已有方案在这三个条件里最多满足一两个。

这篇技术报告提出 AloePri,用 covariant obfuscation 同时变换数据和模型参数,让各个模型组件都能在保持推理正确性的同时隐藏用户输入与输出。它的重点不是一套孤立密码协议,而是把隐私保护嵌入到现有 Language-Model-as-a-Service 基础设施里,支持异构 legacy xPU 集群和大规模模型部署。

它值得收录,因为这是少见真正以工业可部署性为目标的 LLM 隐私推理系统工作。论文在 671B 规模的 DeepSeek-V3.1-Terminus 上报告接近明文推理的效率、0.0%~3.5% 的精度损失,以及对现有攻击的低 token 恢复率,这让它从概念性安全方案推进到了可复用的 serving workflow pattern。

它没有更高一级,是因为目前仍是 technical report,且核心路线仍集中在协变混淆这一特定方案上。它像一篇很强的系统落地工作,但还没到重定义整个 privacy-preserving inference 研究范式的程度。

链接