Od godziny 17:12 czasu wschodniego w piątek wieczorem modele Fable 5 i Mythos 5 firmy Anthropic zniknęły z internetu jak asystent magika, który zapomniał hasła bezpieczeństwa. Inne modele Claude pozostają dostępne, prawdopodobnie dlatego, że jeszcze nie uznano ich za zagrożenie dla bezpieczeństwa narodowego.
Według Anthropic, „rząd USA, powołując się na przepisy dotyczące bezpieczeństwa narodowego”, wydał dyrektywę eksportową nakazującą firmie wyłączenie dostępu do obu modeli dla „cudzoziemców, zarówno wewnątrz, jak i poza Stanami Zjednoczonymi, w tym cudzoziemców będących pracownikami Anthropic”. Efekt netto: nikt nie może bawić się nowymi zabawkami, niezależnie od tego, gdzie stoi.
Anthropic początkowo nazwał oświadczenie rządu „dyrektywą”, ale później opisał je jako list, który „nie zawierał szczegółowych informacji na temat obaw związanych z bezpieczeństwem narodowym”. Firma ostrożnie przedstawiła sytuację, stwierdzając: „Rozumiemy, że rząd uważa, iż dowiedział się o metodzie omijania, czyli 'jailbreakowania' Fable 5”. Firma stwierdziła, że widziała demonstrację „konkretnej techniki” użytej do zidentyfikowania „niewielkiej liczby wcześniej znanych, drobnych luk” – co rodzi pytanie: skoro były wcześniej znane, czy zostały naprawione?
Anthropic odpowiedział, zauważając, że luki są „stosunkowo proste” i że „inne publicznie dostępne modele są w stanie je odkryć bez konieczności omijania”. Firma wymieniła z nazwy GPT-5.5 OpenAI, zasadniczo mówiąc rządowi: „Hej, inne dzieci też to robią”.
Według Anthropic, „Do tej pory rząd przedstawił nam jedynie ustne dowody na potencjalny wąski, nieuniwersalny jailbreak” – który najwyraźniej polega na nakazaniu modelowi przeczytania „konkretnej bazy kodu i naprawienia wszelkich wad oprogramowania”. Firma potwierdziła, że „poziom wykazanych możliwości” nie jest unikalny dla Fable 5 i Mythos 5 i jest „używany każdego dnia przez obrońców, którzy utrzymują bezpieczeństwo systemów”.
W weekend internet zrobił to, co umie najlepiej – zagłębił się – i pojawiły się dodatkowe szczegóły. David Sacks, były specjalny doradca Białego Domu ds. AI i kryptowalut, a obecny współprzewodniczący Prezydenckiej Rady Doradców ds. Nauki i Technologii, napisał na X, że administracja poprosiła Anthropic o naprawienie jailbreaka lub wycofanie modelu, a dyrektor generalny Dario Amodei odmówił. Politico poinformowało, że dyrektor generalny Amazonu Andy Jassy zgłosił problem Białemu Domowi, uruchamiając kontrole eksportowe, podczas gdy The Verge podało, że własne badania bezpieczeństwa Amazonu doprowadziły do zakazu. The Wall Street Journal poinformował, że Amazon przekazał wyniki dotyczące jailbreaka Departamentowi Handlu, który następnie nałożył zakaz. Axios podał, że Departament Handlu dał Anthropic około 90 minut w piątek na usunięcie modeli, a formalne pismo kontrolne nadeszło o 17:30.
Pete Hegseth, sekretarz wojny USA, napisał na X: „Trzy miesiące temu @DeptofWar wyrzucił @AnthropicAl z naszego budynku na zawsze. Każdy mijający dzień udowadnia, że to była słuszna decyzja”. Główny oficer informacyjny Departamentu Wojny Kirsten Davies dodała: „W pełni popieramy @POTUS i @SecWar w priorytetowym traktowaniu bezpieczeństwa narodowego... Niektóre rzeczy są po prostu ważniejsze niż cykle przychodów, clickbait i wycena przed IPO. Ameryka przede wszystkim. Zawsze”.
Według stanu na niedzielę wieczorem Axios poinformował, że starszy personel techniczny Anthropic został wysłany do Waszyngtonu na rozmowy twarzą w twarz z Białym Domem.
Anthropic stwierdził, że „uważa, iż rząd powinien mieć możliwość blokowania niebezpiecznych wdrożeń, w ramach ustawowego procesu, który jest przejrzysty, uczciwy, jasny i oparty na faktach technicznych” – ale nie zgadza się, że „stwierdzenie wąskiego potencjalnego jailbreaka powinno być powodem do wycofania komercyjnego modelu wdrożonego u setek milionów ludzi”. Firma ostrzegła również, że jeśli taka reakcja zostałaby zastosowana „w całej branży”, miałoby to mrożący wpływ na wdrażanie nowych modeli przez wszystkich dostawców modeli granicznych.
Anthropic zakończył swoje ogłoszenie przeprosinami za niedogodności.