OpenAI 推出了 Daybreak,这是一项专注于在攻击者发现之前检测和修补漏洞的 AI 计划。Daybreak 使用了 3 月发布的 Codex 安全 AI 代理,基于组织的代码创建威胁模型,聚焦可能的攻击路径,验证可能的漏洞,然后自动检测高风险漏洞。

它的推出距离竞争对手 Anthropic 宣布 Claude Mythos 仅一个多月。Anthropic 声称 Mythos 是一个安全导向的 AI 模型,过于危险而无法公开发布,仅作为其自身计划(称为 Project Glasswing)的一部分私下分享。然而,这并没有阻止至少少数未经授权的方获得访问权限——因为没有什么比一个迅速泄露的模型更能说明“对公众太危险”了。

然而,OpenAI 此前一直缺乏类似的安全产品。与 Glasswing 一样,Daybreak 并非仅基于一个 AI 模型——OpenAI 表示“Daybreak 汇集了最强大的 OpenAI 模型、Codex 和我们的安全合作伙伴。”

Daybreak 还涉及专门的网络模型,包括上周开始推出的 GPT-5.5 with Trusted Access for Cyber 和 GPT-5.5-Cyber。OpenAI 还表示,它正在与“行业和政府合作伙伴”合作,同时准备“部署越来越具备网络能力的模型”。这些模型最终是否会变得过于危险而无法发布还有待观察——但可以预见的是,总会有人泄露它们。