A partir das 17h12 (horário do leste) na sexta-feira à noite, os modelos Fable 5 e Mythos 5 da Anthropic desapareceram da internet como a assistente de um mágico que esqueceu a palavra de segurança. Outros modelos Claude permanecem disponíveis, presumivelmente porque ainda não foram considerados uma ameaça à segurança nacional.
De acordo com a Anthropic, o "governo dos EUA, citando autoridades de segurança nacional" emitiu uma diretiva de exportação exigindo que a empresa desabilitasse o acesso a ambos os modelos para "qualquer estrangeiro, dentro ou fora dos Estados Unidos, incluindo funcionários estrangeiros da Anthropic." O efeito líquido: ninguém pode brincar com os novos brinquedos, independentemente de onde esteja.
A Anthropic inicialmente chamou a declaração do governo de "diretiva", mas depois a descreveu como uma carta que "não fornecia detalhes específicos de sua preocupação com segurança nacional." A empresa enquadrou cuidadosamente a situação, afirmando: "Nosso entendimento é que o governo acredita ter tomado conhecimento de um método de bypass, ou 'jailbreak' do Fable 5." A empresa disse que viu uma demonstração de uma "técnica específica" usada para identificar "um pequeno número de vulnerabilidades menores previamente conhecidas" — o que levanta a questão: se são previamente conhecidas, foram corrigidas?
A Anthropic rebateu observando que as vulnerabilidades são "relativamente simples" e que "outros modelos disponíveis publicamente também conseguem descobri-las sem exigir um bypass." A empresa mencionou especificamente o GPT-5.5 da OpenAI, essencialmente dizendo ao governo: "Ei, as outras crianças também estão fazendo isso."
Segundo a Anthropic, "Até agora, o governo nos deu apenas evidências verbais de um potencial jailbreak estreito e não universal" — que aparentemente consiste em dizer ao modelo para "ler uma base de código específica e corrigir quaisquer falhas de software." A empresa validou que "o nível de capacidade exibido" não é exclusivo do Fable 5 e Mythos 5, e é "usado todos os dias pelos defensores que mantêm os sistemas seguros."
No fim de semana, a internet fez o que faz de melhor — se aprofundou — e detalhes adicionais surgiram. David Sacks, ex-assessor especial da Casa Branca para IA e cripto e atual copresidente do Conselho de Assessores do Presidente em Ciência e Tecnologia, postou no X que a administração pediu à Anthropic para corrigir o jailbreak ou retirar o modelo, e que o CEO Dario Amodei recusou. A Politico reportou que o CEO da Amazon, Andy Jassy, sinalizou o problema à Casa Branca, colocando controles de exportação em movimento, enquanto o The Verge reportou que a própria pesquisa de segurança da Amazon levou à proibição. O Wall Street Journal reportou que a Amazon levou as descobertas do jailbreak ao Departamento de Comércio, que então impôs a proibição. A Axios reportou que o Comércio deu à Anthropic cerca de 90 minutos na sexta-feira para retirar os modelos, com a carta de controle formal chegando às 17h30.
Pete Hegseth, secretário de guerra dos EUA, postou no X: "Há três meses, @DeptofWar expulsou @AnthropicAl do nosso prédio — para sempre. Cada dia que passa prova por que essa foi a decisão certa." A diretora de informação do Departamento de Guerra, Kirsten Davies, acrescentou: "Apoiamos totalmente @POTUS e @SecWar em priorizar a segurança nacional... Algumas coisas são simplesmente mais importantes que ciclos de receita, clickbait e valuation pré-IPO. América Primeiro. Sempre."
Na noite de domingo, a Axios reportou que funcionários técnicos seniores da Anthropic foram enviados a Washington para discussões presenciais com a Casa Branca.
A Anthropic disse que "acredita que o governo deveria ter a capacidade de bloquear implantações inseguras, como parte de um processo estatutário que seja transparente, justo, claro e baseado em fatos técnicos" — mas discorda que "a descoberta de um jailbreak estreito e potencial deva ser motivo para recolher um modelo comercial implantado para centenas de milhões de pessoas." A empresa também alertou que se essa resposta fosse aplicada "em toda a indústria", teria efeitos assustadores em novas implantações de modelos por todos os provedores de modelos de fronteira.
A Anthropic encerrou seu anúncio pedindo desculpas pela interrupção.