A las 5:12 p.m. ET del viernes por la tarde, los modelos Fable 5 y Mythos 5 de Anthropic desaparecieron de internet como la asistente de un mago que olvidó la palabra de seguridad. Otros modelos Claude siguen disponibles, presumiblemente porque aún no han sido considerados una amenaza a la seguridad nacional.
Según Anthropic, el "gobierno de EE.UU., citando autoridades de seguridad nacional" emitió una directiva de exportación que exige a la empresa deshabilitar el acceso a ambos modelos para "cualquier extranjero, ya sea dentro o fuera de Estados Unidos, incluidos empleados extranjeros de Anthropic". El efecto neto: nadie puede jugar con los nuevos juguetes, sin importar dónde estén parados.
Anthropic inicialmente llamó a la declaración del gobierno una "directiva", pero luego la describió como una carta que "no proporciona detalles específicos de su preocupación de seguridad nacional". La empresa enmarcó cuidadosamente la situación, afirmando: "Nuestro entendimiento es que el gobierno cree que ha tomado conocimiento de un método para eludir, o 'jailbreak', Fable 5". La empresa dijo que vio una demostración de una "técnica específica" utilizada para identificar "un pequeño número de vulnerabilidades menores previamente conocidas" — lo que plantea la pregunta: si ya se conocían, ¿se corrigieron?
Anthropic contraatacó señalando que las vulnerabilidades son "relativamente simples" y que "otros modelos disponibles públicamente también pueden descubrirlas sin necesidad de una elusión". La empresa mencionó específicamente a GPT-5.5 de OpenAI, esencialmente diciéndole al gobierno: "Oye, los otros niños también lo hacen".
Según Anthropic, "Hasta la fecha, el gobierno solo nos ha dado evidencia verbal de un posible jailbreak estrecho y no universal" — que aparentemente consiste en decirle al modelo que "lea un código base específico y corrija cualquier falla de software". La empresa validó que "el nivel de capacidad mostrado" no es exclusivo de Fable 5 y Mythos 5, y es "utilizado todos los días por los defensores que mantienen seguros los sistemas".
Durante el fin de semana, internet hizo lo que mejor sabe hacer — indagar — y surgieron detalles adicionales. David Sacks, exasesor especial de la Casa Blanca para IA y cripto y actual copresidente del Consejo de Asesores del Presidente en Ciencia y Tecnología, publicó en X que la administración pidió a Anthropic corregir el jailbreak o retirar el modelo, y que el CEO Dario Amodei se negó. Politico informó que el CEO de Amazon, Andy Jassy, señaló el problema a la Casa Blanca, poniendo en marcha los controles de exportación, mientras que The Verge reportó que la propia investigación de seguridad de Amazon llevó a la prohibición. The Wall Street Journal informó que Amazon llevó los hallazgos del jailbreak al Departamento de Comercio, que luego impuso la prohibición. Axios reportó que Comercio dio a Anthropic unos 90 minutos el viernes para retirar los modelos, con la carta de control formal llegando a las 5:30 p.m.
Pete Hegseth, secretario de guerra de EE.UU., publicó en X: "Hace tres meses, @DeptofWar echó a @AnthropicAl de nuestro edificio para siempre. Cada día que pasa demuestra por qué fue la decisión correcta". La directora de información del Departamento de Guerra, Kirsten Davies, añadió: "Apoyamos plenamente a @POTUS y @SecWar en priorizar la seguridad nacional... Algunas cosas son simplemente más importantes que los ciclos de ingresos, el clickbait y la valoración previa a la OPI. América Primero. Siempre".
Al anochecer del domingo, Axios informó que personal técnico superior de Anthropic fue enviado a Washington para conversaciones cara a cara con la Casa Blanca.
Anthropic dijo que "cree que el gobierno debería tener la capacidad de bloquear despliegues inseguros, como parte de un proceso estatutario que sea transparente, justo, claro y fundamentado en hechos técnicos" — pero no está de acuerdo en que "el hallazgo de un jailbreak estrecho potencial deba ser motivo para retirar un modelo comercial desplegado para cientos de millones de personas". La empresa también advirtió que si esta respuesta se aplicara "en toda la industria", tendría efectos paralizantes en los nuevos despliegues de modelos por parte de todos los proveedores de modelos frontera.
Anthropic terminó su anuncio disculpándose por la interrupción.