Towards Privacy-Preserving LLM Inference via Collaborative Obfuscation (Technical Report)

科学发现旗舰工作突破级暂无讲解视频

发表时间: 2026-03-02
arXiv: 2603.01499

收录解读

云端 LLM 推理把能力交给了大模型服务，但也把用户输入与输出暴露给远端系统，这使真正可用的 privacy-preserving inference 一直卡在一个很现实的工程约束上：不能只讲安全，还要同时保证大模型精度、工业级吞吐，以及和现有 serving 基础设施的兼容性。很多已有方案在这三个条件里最多满足一两个。

这篇技术报告提出 AloePri，用 covariant obfuscation 同时变换数据和模型参数，让各个模型组件都能在保持推理正确性的同时隐藏用户输入与输出。它的重点不是一套孤立密码协议，而是把隐私保护嵌入到现有 Language-Model-as-a-Service 基础设施里，支持异构 legacy xPU 集群和大规模模型部署。

它值得收录，因为这是少见真正以工业可部署性为目标的 LLM 隐私推理系统工作。论文在 671B 规模的 DeepSeek-V3.1-Terminus 上报告接近明文推理的效率、0.0%~3.5% 的精度损失，以及对现有攻击的低 token 恢复率，这让它从概念性安全方案推进到了可复用的 serving workflow pattern。

它没有更高一级，是因为目前仍是 technical report，且核心路线仍集中在协变混淆这一特定方案上。它像一篇很强的系统落地工作，但还没到重定义整个 privacy-preserving inference 研究范式的程度。

链接

论文链接