À 17h12, heure de l'Est, vendredi soir, les modèles Fable 5 et Mythos 5 d'Anthropic ont disparu d'Internet comme l'assistante d'un magicien qui aurait oublié le mot de sécurité. Les autres modèles Claude restent disponibles, probablement parce qu'ils n'ont pas encore été jugés comme une menace pour la sécurité nationale.
Selon Anthropic, le « gouvernement américain, invoquant les autorités de sécurité nationale » a émis une directive d'exportation exigeant que l'entreprise désactive l'accès aux deux modèles pour « tout ressortissant étranger, que ce soit à l'intérieur ou à l'extérieur des États-Unis, y compris les employés étrangers d'Anthropic ». Résultat net : personne ne peut jouer avec les nouveaux jouets, peu importe où il se trouve.
Anthropic a d'abord qualifié la déclaration du gouvernement de « directive », mais l'a ensuite décrite comme une lettre qui ne « fournissait pas de détails spécifiques sur ses préoccupations de sécurité nationale ». L'entreprise a soigneusement présenté la situation, déclarant : « Nous comprenons que le gouvernement croit avoir pris connaissance d'une méthode pour contourner, ou 'jailbreaker', Fable 5. » L'entreprise a déclaré avoir vu une démonstration d'une « technique spécifique » utilisée pour identifier « un petit nombre de vulnérabilités mineures déjà connues » – ce qui soulève la question : si elles étaient déjà connues, ont-elles été corrigées ?
Anthropic a riposté en notant que les vulnérabilités sont « relativement simples » et que « d'autres modèles disponibles publiquement peuvent également les découvrir sans nécessiter de contournement ». L'entreprise a spécifiquement cité GPT-5.5 d'OpenAI, disant essentiellement au gouvernement : « Hé, les autres enfants le font aussi. »
Selon Anthropic, « À ce jour, le gouvernement ne nous a donné que des preuves verbales d'un potentiel jailbreak étroit et non universel » – ce qui semble consister à demander au modèle de « lire une base de code spécifique et de corriger les défauts logiciels ». L'entreprise a validé que « le niveau de capacité démontré » n'est pas unique à Fable 5 et Mythos 5, et est « utilisé quotidiennement par les défenseurs qui maintiennent les systèmes en sécurité ».
Pendant le week-end, Internet a fait ce qu'il fait de mieux – creuser – et des détails supplémentaires ont émergé. David Sacks, ancien conseiller spécial de la Maison Blanche pour l'IA et les crypto-monnaies et actuel coprésident du Conseil présidentiel des conseillers en science et technologie, a posté sur X que l'administration a demandé à Anthropic de corriger le jailbreak ou de retirer le modèle, et que le PDG Dario Amodei a refusé. Politico a rapporté que le PDG d'Amazon, Andy Jassy, a signalé le problème à la Maison Blanche, déclenchant des contrôles à l'exportation, tandis que The Verge a rapporté que les propres recherches de sécurité d'Amazon ont conduit à l'interdiction. Le Wall Street Journal a rapporté qu'Amazon a porté les résultats du jailbreak au département du Commerce, qui a ensuite imposé l'interdiction. Axios a rapporté que le Commerce a donné à Anthropic environ 90 minutes vendredi pour retirer les modèles, la lettre de contrôle formelle suivant à 17h30.
Pete Hegseth, secrétaire à la Guerre des États-Unis, a posté sur X : « Il y a trois mois, @DeptofWar a viré @AnthropicAl de notre bâtiment – pour toujours. Chaque jour qui passe prouve pourquoi c'était la bonne décision. » La directrice de l'information du département de la Guerre, Kirsten Davies, a ajouté : « Nous soutenons pleinement @POTUS et @SecWar dans la priorisation de la sécurité nationale... Certaines choses sont simplement plus importantes que les cycles de revenus, le clickbait et la valorisation pré-IPO. L'Amérique d'abord. Toujours. »
Dimanche soir, Axios a rapporté que des cadres techniques supérieurs d'Anthropic ont été envoyés à Washington pour des discussions en face à face avec la Maison Blanche.
Anthropic a déclaré qu'elle « croit que le gouvernement devrait avoir la capacité de bloquer les déploiements dangereux, dans le cadre d'un processus légal transparent, équitable, clair et fondé sur des faits techniques » – mais est en désaccord sur le fait que « la découverte d'un jailbreak potentiel étroit devrait être une raison pour rappeler un modèle commercial déployé auprès de centaines de millions de personnes ». L'entreprise a également averti que si cette réponse était appliquée « à l'ensemble de l'industrie », elle aurait des effets dissuasifs sur les déploiements de nouveaux modèles par tous les fournisseurs de modèles de pointe.
Anthropic a terminé son annonce en s'excusant pour la désorganisation.