OpenAI 推出 Daybreak，修补 Anthropic 的 Mythos 不敢提及的漏洞

OpenAI 终于以 Daybreak 加入 AI 安全军备竞赛，恰逢 Anthropic 声称过于危险而无法发布的 Claude Mythos 开始从后门溜出。

OpenAI 推出了 Daybreak，这是一项专注于在攻击者发现之前检测和修补漏洞的 AI 计划。Daybreak 使用了 3 月发布的 Codex 安全 AI 代理，基于组织的代码创建威胁模型，聚焦可能的攻击路径，验证可能的漏洞，然后自动检测高风险漏洞。

它的推出距离竞争对手 Anthropic 宣布 Claude Mythos 仅一个多月。Anthropic 声称 Mythos 是一个安全导向的 AI 模型，过于危险而无法公开发布，仅作为其自身计划（称为 Project Glasswing）的一部分私下分享。然而，这并没有阻止至少少数未经授权的方获得访问权限——因为没有什么比一个迅速泄露的模型更能说明“对公众太危险”了。

然而，OpenAI 此前一直缺乏类似的安全产品。与 Glasswing 一样，Daybreak 并非仅基于一个 AI 模型——OpenAI 表示“Daybreak 汇集了最强大的 OpenAI 模型、Codex 和我们的安全合作伙伴。”

Daybreak 还涉及专门的网络模型，包括上周开始推出的 GPT-5.5 with Trusted Access for Cyber 和 GPT-5.5-Cyber。OpenAI 还表示，它正在与“行业和政府合作伙伴”合作，同时准备“部署越来越具备网络能力的模型”。这些模型最终是否会变得过于危险而无法发布还有待观察——但可以预见的是，总会有人泄露它们。

OpenAI 推出 Daybreak，修补 Anthropic 的 Mythos 不敢提及的漏洞

新闻直达您的邮箱。