Începând cu ora 17:12, ora de est, vineri seara, modelele Fable 5 și Mythos 5 ale Anthropic au dispărut de pe internet ca asistentul unui magician care a uitat cuvântul de siguranță. Alte modele Claude rămân disponibile, probabil pentru că nu au fost încă considerate o amenințare la securitatea națională.
Potrivit Anthropic, „guvernul SUA, invocând autoritățile de securitate națională” a emis o directivă de export care impune companiei să dezactiveze accesul la ambele modele pentru „orice cetățean străin, fie în interiorul, fie în afara Statelor Unite, inclusiv angajații străini ai Anthropic”. Efectul net: nimeni nu se poate juca cu noile jucării, indiferent unde se află.
Anthropic a numit inițial declarația guvernului o „directivă”, dar mai târziu a descris-o ca pe o scrisoare care „nu oferă detalii specifice cu privire la preocuparea sa de securitate națională”. Compania a încadrat cu grijă situația, afirmând: „Înțelegerea noastră este că guvernul crede că a aflat despre o metodă de ocolire sau „jailbreak” a Fable 5.” Compania a spus că a văzut o demonstrație a unei „tehnici specifice” folosite pentru a identifica „un număr mic de vulnerabilități minore cunoscute anterior” – ceea ce ridică întrebarea: dacă erau cunoscute anterior, au fost reparate?
Anthropic a ripostat observând că vulnerabilitățile sunt „relativ simple” și că „alte modele disponibile public le pot descoperi la fel de bine fără a necesita o ocolire”. Compania a menționat în mod specific GPT-5.5 de la OpenAI, spunând efectiv guvernului: „Hei, și ceilalți copii fac asta.”
Potrivit Anthropic, „Până în prezent, guvernul ne-a oferit doar dovezi verbale ale unui potențial jailbreak îngust, non-universal” – care aparent constă în a spune modelului să citească un „cod sursă specific și să repare orice defecte software”. Compania a validat că „nivelul de capacitate afișat” nu este unic pentru Fable 5 și Mythos 5 și este „folosit în fiecare zi de apărătorii care mențin sistemele în siguranță.”
În weekend, internetul a făcut ceea ce face cel mai bine – a săpat – și au apărut detalii suplimentare. David Sacks, fost consilier special al Casei Albe pentru AI și cripto și actual co-președinte al Consiliului Prezidențial al Consilierilor pentru Știință și Tehnologie, a postat pe X că administrația i-a cerut lui Anthropic să repare jailbreak-ul sau să retragă modelul, iar CEO-ul Dario Amodei a refuzat. Politico a raportat că CEO-ul Amazon, Andy Jassy, a semnalat problema Casei Albe, punând în mișcare controalele la export, în timp ce The Verge a raportat că propria cercetare de securitate a Amazon a dus la interdicție. The Wall Street Journal a raportat că Amazon a dus descoperirile jailbreak-ului la Departamentul Comerțului, care apoi a impus interdicția. Axios a raportat că Comerțul i-a dat Anthropic aproximativ 90 de minute vineri pentru a scoate modelele, scrisoarea oficială de control urmând la ora 17:30.
Pete Hegseth, secretarul de război al SUA, a postat pe X: „Acum trei luni, @DeptofWar l-a dat afară pe @AnthropicAl din clădirea noastră – pentru totdeauna. Fiecare zi care trece dovedește de ce aceasta a fost decizia corectă.” Ofițerul șef de informații al Departamentului de Război, Kirsten Davies, a adăugat: „Susținem pe deplin @POTUS și @SecWar în prioritizarea securității naționale... Unele lucruri sunt pur și simplu mai importante decât ciclurile de venituri, clickbait-ul și evaluarea pre-IPO. America pe primul loc. Întotdeauna.”
Duminică seara, Axios a raportat că personalul tehnic superior al Anthropic a fost trimis la Washington pentru discuții față în față cu Casa Albă.
Anthropic a spus că „crede că guvernul ar trebui să aibă capacitatea de a bloca implementările nesigure, ca parte a unui proces statutar care este transparent, corect, clar și bazat pe fapte tehnice” – dar nu este de acord că „descoperirea unui jailbreak îngust potențial ar trebui să fie un motiv pentru retragerea unui model comercial implementat la sute de milioane de oameni.” Compania a avertizat, de asemenea, că dacă acest răspuns ar fi aplicat „în întreaga industrie”, ar avea efecte de descurajare asupra implementărilor de noi modele de către toți furnizorii de modele de frontieră.
Anthropic și-a încheiat anunțul cerând scuze pentru întrerupere.