安全、治理与可靠性
突破级
暂无讲解视频
收录解读
DTap 针对 agent 安全评估的核心问题:agent 会在动态、不可信、多工具环境中执行长程动作,传统静态 jailbreak 测试不足以覆盖实际风险。
平台覆盖 14 个真实世界域和 50 多个模拟环境,复现 Google Workspace、PayPal、Slack 等常见系统中的工具调用、数据流和高风险操作。
它值得正式收录,因为它提供可控、可交互、可复现的 agent red-teaming interface,并进一步引入 DTap-Red 自动化红队 agent 扩展评估规模。
它没有更高,是因为红队平台的长期价值取决于环境真实性、攻击覆盖、社区采用和与真实权限系统的对接深度。