Am Freitagabend um 17:12 Uhr ET verschwanden Anthropics Modelle Fable 5 und Mythos 5 aus dem Internet wie die Assistentin eines Magiers, die das Sicherheitswort vergessen hat. Andere Claude-Modelle bleiben verfügbar, vermutlich weil sie noch nicht als nationale Sicherheitsbedrohung eingestuft wurden.

Laut Anthropic erließ die „US-Regierung unter Berufung auf nationale Sicherheitsbehörden“ eine Exportrichtlinie, die das Unternehmen verpflichtet, den Zugang zu beiden Modellen für „alle ausländischen Staatsangehörigen, ob innerhalb oder außerhalb der USA, einschließlich ausländischer Anthropic-Mitarbeiter“ zu sperren. Der Nettoeffekt: Niemand darf mit den neuen Spielzeugen spielen, egal wo er steht.

Anthropic nannte die Aussage der Regierung zunächst eine „Direktive“, später jedoch einen Brief, der „keine spezifischen Details zu den nationalen Sicherheitsbedenken“ enthielt. Das Unternehmen formulierte die Situation vorsichtig: „Unser Verständnis ist, dass die Regierung glaubt, von einer Methode zur Umgehung oder zum ‚Jailbreak‘ von Fable 5 erfahren zu haben.“ Das Unternehmen sagte, es habe eine Demonstration einer „spezifischen Technik“ gesehen, mit der „eine kleine Anzahl zuvor bekannter, geringfügiger Schwachstellen“ identifiziert wurden – was die Frage aufwirft: Wenn sie bereits bekannt waren, wurden sie behoben?

Anthropic konterte mit dem Hinweis, dass die Schwachstellen „relativ einfach“ seien und dass „andere öffentlich verfügbare Modelle sie ebenfalls erkennen können, ohne einen Bypass zu benötigen“. Das Unternehmen nannte ausdrücklich OpenAIs GPT-5.5 und sagte der Regierung im Grunde: „Hey, die anderen Kinder machen das auch.“

Laut Anthropic hat die Regierung „bisher nur mündliche Beweise für einen potenziell engen, nicht universellen Jailbreak“ vorgelegt – der offenbar darin besteht, das Modell anzuweisen, eine „spezifische Codebasis zu lesen und alle Softwarefehler zu beheben“. Das Unternehmen bestätigte, dass „das gezeigte Leistungsniveau“ nicht einzigartig für Fable 5 und Mythos 5 sei und „täglich von den Verteidigern genutzt wird, die Systeme sicher halten“.

Über das Wochenende tat das Internet, was es am besten kann – es grub tiefer – und weitere Details kamen ans Licht. David Sacks, ehemaliger Sonderberater des Weißen Hauses für KI und Krypto und derzeitiger Co-Vorsitzender des Präsidialrates für Wissenschaft und Technologie, postete auf X, dass die Regierung Anthropic aufforderte, den Jailbreak zu beheben oder das Modell zurückzuziehen, und CEO Dario Amodei sich weigerte. Politico berichtete, dass Amazon-CEO Andy Jassy das Problem dem Weißen Haus meldete, was Exportkontrollen in Gang setzte, während The Verge berichtete, dass Amazons eigene Sicherheitsforschung zu dem Verbot führte. Das Wall Street Journal berichtete, dass Amazon die Jailbreak-Erkenntnisse dem Handelsministerium vorlegte, das dann das Verbot verhängte. Axios berichtete, dass das Handelsministerium Anthropic etwa 90 Minuten am Freitag gab, um die Modelle offline zu nehmen, wobei der formelle Kontrollbrief um 17:30 Uhr folgte.

Pete Hegseth, US-Kriegsminister, postete auf X: „Vor drei Monaten hat @DeptofWar @AnthropicAl für immer aus unserem Gebäude geworfen. Jeder Tag beweist, warum das die richtige Entscheidung war.“ Die Chief Information Officer des Kriegsministeriums, Kirsten Davies, fügte hinzu: „Wir unterstützen @POTUS und @SecWar voll und ganz bei der Priorisierung der nationalen Sicherheit... Manche Dinge sind einfach wichtiger als Umsatzzyklen, Clickbait und Pre-IPO-Bewertungen. America First. Immer.“

Am Sonntagabend berichtete Axios, dass leitende technische Mitarbeiter von Anthropic nach Washington entsandt wurden, um persönliche Gespräche mit dem Weißen Haus zu führen.

Anthropic sagte, es „glaube, dass die Regierung die Möglichkeit haben sollte, unsichere Bereitstellungen zu blockieren, als Teil eines gesetzlichen Verfahrens, das transparent, fair, klar und auf technischen Fakten basiert“ – ist aber anderer Meinung, dass „der Fund eines engen potenziellen Jailbreaks ein Grund sein sollte, ein kommerzielles Modell zurückzurufen, das Hunderten Millionen Menschen bereitgestellt wurde“. Das Unternehmen warnte auch, dass, wenn diese Reaktion „branchenweit“ angewendet würde, dies abschreckende Auswirkungen auf die Bereitstellung neuer Modelle aller Grenzmodellanbieter hätte.

Anthropic beendete seine Ankündigung mit einer Entschuldigung für die Unannehmlichkeiten.