智能体与自主科学
突破级
暂无讲解视频
收录解读
这篇论文指出当前 LLM agent 默认服务单一用户或单一 principal,但真实组织和团队工具中,一个 agent 经常同时服务多个用户,且这些用户具有不同角色、偏好、权限和隐私边界。多用户场景天然带来目标冲突、信息不对称和协调成本,是单用户 instruction following 无法覆盖的系统问题。
论文把多用户 LLM agent 形式化为 multi-principal decision problem,并提出统一的多用户交互协议与三个压力测试场景,分别考察模型在冲突指令优先级、隐私保持和协作协调中的表现。结果显示前沿模型在多轮交互中会出现优先级漂移、隐私泄露增加和低效信息收集。
它值得收录,是因为它为 agent 从个人助手走向组织级协作系统提供了基础问题定义和评测接口,与 ManyIH 的权限层级问题互补:ManyIH 关注指令权限解析,本论文关注多 principal 的效用、隐私和协调。它对企业 agent、团队工作流 agent 和共享工具代理具有直接设计意义。
局限在于它主要是问题形式化和压力测试,尚未给出稳定的训练/协议解决方案;多用户效用函数如何定义、审计和落地仍是开放问题。因此它是 agent 评测与系统 framing 的突破性补录,而不是完整解决方案。