Alle 17:12 ET di venerdì sera, i modelli Fable 5 e Mythos 5 di Anthropic sono scomparsi da internet come l'assistente di un mago che ha dimenticato la parola di sicurezza. Gli altri modelli Claude rimangono disponibili, presumibilmente perché non sono ancora stati considerati una minaccia per la sicurezza nazionale.
Secondo Anthropic, il "governo USA, citando le autorità di sicurezza nazionale" ha emesso una direttiva di esportazione che impone all'azienda di disabilitare l'accesso a entrambi i modelli per "qualsiasi cittadino straniero, sia dentro che fuori dagli Stati Uniti, inclusi i dipendenti stranieri di Anthropic". L'effetto netto: nessuno può giocare con i nuovi giocattoli, indipendentemente da dove si trovi.
Anthropic inizialmente ha definito la dichiarazione del governo una "direttiva", ma in seguito l'ha descritta come una lettera che "non forniva dettagli specifici sulla sua preoccupazione di sicurezza nazionale". L'azienda ha inquadrato attentamente la situazione, affermando: "La nostra comprensione è che il governo ritiene di essere venuto a conoscenza di un metodo per bypassare, o 'jailbreak', Fable 5". L'azienda ha dichiarato di aver visto una dimostrazione di una "tecnica specifica" utilizzata per identificare "un piccolo numero di vulnerabilità minori precedentemente note" - il che solleva la domanda: se erano note, sono state corrette?
Anthropic ha replicato sottolineando che le vulnerabilità sono "relativamente semplici" e che "altri modelli disponibili pubblicamente sono in grado di scoprirle altrettanto bene senza bisogno di un bypass". L'azienda ha specificamente menzionato GPT-5.5 di OpenAI, dicendo essenzialmente al governo: "Ehi, anche gli altri ragazzi lo fanno".
Secondo Anthropic, "Ad oggi, il governo ci ha fornito solo prove verbali di un potenziale jailbreak ristretto e non universale" - che apparentemente consiste nel dire al modello di "leggere un codebase specifico e correggere eventuali difetti software". L'azienda ha convalidato che "il livello di capacità mostrato" non è unico per Fable 5 e Mythos 5, ed è "usato ogni giorno dai difensori che mantengono i sistemi al sicuro".
Durante il fine settimana, internet ha fatto ciò che sa fare meglio - ha scavato - e sono emersi ulteriori dettagli. David Sacks, ex consigliere speciale della Casa Bianca per l'IA e le criptovalute e attuale co-presidente del Consiglio presidenziale dei consulenti per la scienza e la tecnologia, ha postato su X che l'amministrazione ha chiesto ad Anthropic di correggere il jailbreak o ritirare il modello, e che l'amministratore delegato Dario Amodei ha rifiutato. Politico ha riportato che l'amministratore delegato di Amazon Andy Jassy ha segnalato il problema alla Casa Bianca, mettendo in moto i controlli sulle esportazioni, mentre The Verge ha riportato che la stessa ricerca sulla sicurezza di Amazon ha portato al divieto. Il Wall Street Journal ha riportato che Amazon ha portato le scoperte sul jailbreak al Dipartimento del Commercio, che poi ha imposto il divieto. Axios ha riportato che il Commercio ha dato ad Anthropic circa 90 minuti venerdì per rimuovere i modelli, con la lettera di controllo formale che è seguita alle 17:30.
Pete Hegseth, segretario alla guerra degli Stati Uniti, ha postato su X: "Tre mesi fa, @DeptofWar ha cacciato @AnthropicAl dal nostro edificio per sempre. Ogni giorno che passa dimostra che è stata la mossa giusta." Il Chief Information Officer del Dipartimento della Guerra Kirsten Davies ha aggiunto: "Sosteniamo pienamente @POTUS e @SecWar nel dare priorità alla sicurezza nazionale... Alcune cose sono semplicemente più importanti dei cicli di fatturato, del clickbait e della valutazione pre-IPO. America First. Sempre."
A domenica sera, Axios ha riportato che il personale tecnico senior di Anthropic è stato inviato a Washington per discussioni faccia a faccia con la Casa Bianca.
Anthropic ha dichiarato di "ritenere che il governo dovrebbe avere la capacità di bloccare distribuzioni non sicure, come parte di un processo statutario che sia trasparente, equo, chiaro e basato su fatti tecnici" - ma non è d'accordo sul fatto che "la scoperta di un potenziale jailbreak ristretto dovrebbe essere motivo per ritirare un modello commerciale distribuito a centinaia di milioni di persone". L'azienda ha anche avvertito che se questa risposta fosse applicata "in tutto il settore", avrebbe effetti negativi sulle nuove distribuzioni di modelli da parte di tutti i fornitori di modelli all'avanguardia.
Anthropic ha concluso il suo annuncio scusandosi per l'interruzione.