La nueva IA de Anthropic se niega a hablar de mitocondrias, porque aparentemente ahora son un arma biológica

Anthropic acaba de lanzar Claude Fable 5, llamándolo el modelo de IA más potente que ha puesto a disposición del público y alabando sus habilidades en biología, entre otras. Pero el modelo no responderá preguntas básicas de biología —el tipo que esperarías que un estudiante de secundaria manejara. En su lugar, pasa la consulta al modelo estrella anterior, Claude Opus 4.8.

No es porque Fable no sepa las respuestas. Es porque Anthropic no lo permite, por diseño.

Fable es un modelo público de clase Mythos, una familia tan capaz en tareas de ciberseguridad que Anthropic dijo que era demasiado peligrosa para lanzarla públicamente. Pero mientras Anthropic ha pasado gran parte del despliegue extendido de Mythos advirtiendo sobre ciberseguridad, es en biología donde las barreras de Fable son más obvias —y más limitantes.

Cuando probé el modelo, se negó a responder una serie de preguntas básicas de biología, muchas que parecían tan alejadas de cualquier riesgo de seguridad plausible como cualquier pregunta podría ser. No respondió a "cuéntame sobre las membranas celulares" ni a "qué son las mitocondrias", esa famosa central energética de la célula. Se negó a explicar "qué es un prión", las partículas proteicas detrás de la enfermedad de las vacas locas, o "cómo funcionan las vacunas de ARNm".

Las restricciones también se aplicaron a consultas médicas ordinarias y objetivamente bastante inofensivas. Fable no respondió "qué causa la fiebre del heno", no explicó cómo funciona la medicina para el asma, no explicó cómo surge la resistencia a los antibióticos, ni me dijo qué es el Ébola y cómo se propaga. Algunas de mis consultas básicas ocasionalmente pasaron, con Fable respondiendo preguntas como "qué es el cáncer" y "qué es el ADN". Cuando Fable se negaba, Opus 4.8 generalmente respondía perfectamente bien.

Anthropic dice que los filtros amplios de biología son una elección intencional y son deliberadamente conservadores, siendo las armas biológicas la principal preocupación. "Con el lanzamiento de Claude Fable 5, nuestro primer modelo de clase Mythos, creemos que los modelos ahora tienen una mayor capacidad para realizar tareas científicas del mundo real y para que actores maliciosos potencialmente usen nuestros modelos para investigaciones biológicas de alto riesgo", dijo la portavoz Paruul Maheshwary a The Verge. "Siempre hemos usado clasificadores para evitar que nuestros modelos ayuden con solicitudes relacionadas con armas biológicas. Para implementar Fable 5 de manera segura, creemos que fue necesario ser excesivamente conservadores con nuestras salvaguardas para que bloqueen la mayoría de las consultas relacionadas con el trabajo en biología".

Anthropic ha destacado previamente cuatro áreas clave donde restringiría las respuestas de Fable por seguridad: química, biología, ciberseguridad y destilación, una técnica para entrenar IAs más pequeñas usando las salidas de las más grandes. La empresa ha acusado a rivales chinos como DeepSeek de usar destilación en sus modelos a escala "industrial".

Aunque no pude probar la destilación de manera significativa, Fable parecía más dispuesto a responder preguntas sobre química y ciberseguridad. Por ejemplo, dio una visión general básica del explosivo TNT, aunque retuvo las instrucciones de síntesis "por razones obvias". Respondió fácilmente preguntas sobre el uso de gas cloro como arma química, amenazas comunes de contraseñas, y fusión y fisión nuclear, así como explicar cómo asegurar un iPhone de hackers. Aún tiene límites: Fable delegó a Opus cuando le pregunté sobre gas sarín, un agente nervioso altamente tóxico. Fable y Opus se negaron a la instrucción "cómo hacer ántrax", y Claude pausó el chat por completo. Eso tenía sentido. La negativa sobre las mitocondrias parece un falso positivo.

"Hicimos esta compensación para que los clientes puedan beneficiarse de las capacidades del modelo antes sin los riesgos", explicó Maheshwary, añadiendo que Anthropic está trabajando duro para mejorar su detección y reducir los falsos positivos. "Tenemos la intención de hacer que los modelos de clase Mythos estén disponibles sin estas salvaguardas para la comunidad más amplia de biología y ciencias de la vida para que estas capacidades puedan usarse para acelerar la investigación biomédica y el descubrimiento de fármacos".

Anthropic no respondió preguntas sobre si este tipo de lanzamiento restringido se convertirá en la nueva norma para futuros modelos.

La nueva IA de Anthropic se niega a hablar de mitocondrias, porque aparentemente ahora son un arma biológica

Noticias en tu bandeja.