Vanaf 17:12 uur ET vrijdagavond verdwenen Anthropic's Fable 5 en Mythos 5 modellen van het internet als een goochelaarsassistent die het veiligheidswoord vergat. Andere Claude-modellen blijven beschikbaar, vermoedelijk omdat ze nog niet als een nationale veiligheidsdreiging zijn bestempeld.
Volgens Anthropic vaardigde de "Amerikaanse overheid, onder verwijzing naar nationale veiligheidsautoriteiten" een exportrichtlijn uit die het bedrijf verplichtte de toegang tot beide modellen uit te schakelen voor "buitenlandse nationaliteiten, zowel binnen als buiten de Verenigde Staten, inclusief buitenlandse nationaliteiten die bij Anthropic werken." Het netto-effect: niemand mag met de nieuwe speeltjes spelen, ongeacht waar ze staan.
Anthropic noemde de verklaring van de overheid aanvankelijk een "richtlijn" maar omschreef het later als een brief die "geen specifieke details gaf over de nationale veiligheidszorgen." Het bedrijf schetste de situatie voorzichtig: "Ons begrip is dat de overheid gelooft dat ze op de hoogte is geraakt van een methode om Fable 5 te omzeilen of te 'jailbreaken'." Het bedrijf zei een demonstratie te hebben gezien van een "specifieke techniek" die werd gebruikt om "een klein aantal eerder bekende, kleine kwetsbaarheden" te identificeren - wat de vraag oproept: als ze eerder bekend waren, zijn ze dan opgelost?
Anthropic kaatste terug door op te merken dat de kwetsbaarheden "relatief eenvoudig" zijn en dat "andere openbaar beschikbare modellen ze ook kunnen ontdekken zonder een omzeiling nodig te hebben." Het bedrijf noemde specifiek OpenAI's GPT-5.5, waarmee het de overheid in feite vertelde: "Hé, de andere kinderen doen het ook."
Volgens Anthropic: "Tot nu toe heeft de overheid ons alleen mondeling bewijs gegeven van een potentiële smalle, niet-universele jailbreak" - die blijkbaar bestaat uit het vertellen van het model om een "specifieke codebase te lezen en eventuele softwarefouten te herstellen." Het bedrijf valideerde dat "het niveau van getoonde capaciteit" niet uniek is voor Fable 5 en Mythos 5, en "elke dag wordt gebruikt door de verdedigers die systemen veilig houden."
In het weekend deed het internet wat het het beste doet - graven - en kwamen er extra details naar boven. David Sacks, voormalig speciaal adviseur van het Witte Huis voor AI en crypto en huidig covoorzitter van de President's Council of Advisors on Science and Technology, plaatste op X dat de regering Anthropic vroeg de jailbreak te repareren of het model terug te trekken, en dat CEO Dario Amodei weigerde. Politico meldde dat Amazon CEO Andy Jassy het probleem bij het Witte Huis aankaartte, wat exportcontroles in gang zette, terwijl The Verge meldde dat Amazon's eigen beveiligingsonderzoek tot het verbod leidde. The Wall Street Journal meldde dat Amazon de jailbreak-bevindingen naar het ministerie van Handel bracht, dat vervolgens het verbod oplegde. Axios meldde dat Commerce Anthropic ongeveer 90 minuten de tijd gaf op vrijdag om de modellen offline te halen, met de formele controlebrief om 17:30 uur.
Pete Hegseth, Amerikaanse minister van Oorlog, plaatste op X: "Drie maanden geleden schopte @DeptofWar @AnthropicAl uit ons gebouw - voor altijd. Elke dag bewijst waarom dat de juiste zet was." Chief Information Officer van het Ministerie van Oorlog Kirsten Davies voegde toe: "We steunen @POTUS en @SecWar volledig in het prioriteren van nationale veiligheid... Sommige dingen zijn simpelweg belangrijker dan inkomstencycli, clickbait en pre-IPO-waardering. America First. Altijd."
Zondagavond meldde Axios dat senior technisch personeel van Anthropic naar Washington werd gestuurd voor face-to-face gesprekken met het Witte Huis.
Anthropic zei dat het "gelooft dat de overheid de mogelijkheid moet hebben om onveilige implementaties te blokkeren, als onderdeel van een wettelijk proces dat transparant, eerlijk, duidelijk en gebaseerd is op technische feiten" - maar is het oneens dat "de bevinding van een smalle potentiële jailbreak reden zou moeten zijn voor het terugroepen van een commercieel model dat is geïmplementeerd bij honderden miljoenen mensen." Het bedrijf waarschuwde ook dat als deze reactie "in de hele industrie" zou worden toegepast, dit een verlammend effect zou hebben op nieuwe modelimplementaties door alle grensverleggende modelaanbieders.
Anthropic sloot zijn aankondiging af met excuses voor de verstoring.