El mundo de la IA tiene una nueva obsesión brillante, y viene en forma de tres letras: RSI. No, no es la lesión por esfuerzo repetitivo, aunque la adopción frenética de palabras de moda en la industria podría causar eso también. Este RSI significa Auto-Mejora Recursiva, la última palabra de moda que hace que startups e investigadores persigan una visión de una IA que pueda mejorarse a sí misma sin la molesta interferencia humana.
En teoría, RSI es simple: un sistema de IA que mejora continuamente sus propias capacidades, eventualmente cerrando el ciclo para que los humanos se vuelvan opcionales, o peor, obsoletos. En la práctica, como con la AGI antes, nadie puede ponerse de acuerdo sobre lo que realmente significa o cuándo podría llegar. Pero eso no ha detenido el tren del hype.
A principios de este mes, el renombrado investigador de IA Richard Socher lanzó una startup llamada Recursive Superintelligence, cuyo enfoque principal es construir "superinteligencia recursiva y auto-mejorable a escala". Socher le dijo a TechCrunch que el objetivo es automatizar "todo el proceso de ideación, implementación y validación de ideas de investigación". Básicamente, una IA que pueda inventar su propia tarea, hacerla y calificarse a sí misma. ¿Qué podría salir mal?
Socher no está solo. Alex Karpathy, exalumno de Tesla y OpenAI ahora en Anthropic, ha estado trabajando en un proyecto llamado Auto-Research, utilizando enjambres de agentes para entrenar LLMs en tareas simples. Hasta ahora, su trabajo se ha limitado a mejoras menores en un modelo a escala GPT-2, que, como el propio Karpathy señaló, "no es investigación 'novedosa' y 'revolucionaria' (todavía)". Pero es suficiente para mantener vivo el sueño.
Adaption, fundada por la exalumna de Cohere y Google Sara Hooker, lanzó recientemente AutoScientist, una herramienta destinada a automatizar el entrenamiento de frontera. Al igual que el sistema de Karpathy, entrena agentes para hacer mejoras incrementales, pero con la gran ambición de entrenar un modelo de frontera a gran escala. Si eso funciona, el sistema podría rápidamente convertirse en algo muy parecido a RSI.
La fundadora de Disarray, Doris Xin, tomó un enfoque más práctico: su agente de aprendizaje automático auto-entrenado ganó 28 medallas en una reciente competencia de Kaggle, superando a muchos agentes entrenados por humanos. Xin argumenta que con cómputo y tiempo infinitos, "ya estamos allí". Insiste en que no se trata de creatividad, solo de "ingeniería de carne y patatas".
Pero hay evidencia de que la industria no está tan cerca como sugiere el hype. El CEO de Google, Sundar Pichai, admitió recientemente: "Todavía no estamos del todo allí", describiendo RSI como "un siguiente nivel de aceleración con muchas implicaciones". Mientras tanto, la herramienta Claude Code de Anthropic está escribiendo cerca del 100% del código de su propio equipo. Una encuesta reciente encontró que cinco de 18 ingenieros de Anthropic creían que Mythos podría pronto sustituir a un ingeniero L4, un programador de nivel medio. Sin embargo, el informe señaló debilidades en la autodirección, incluyendo "gestión autónoma de tareas ambiguas de una semana, comprensión de prioridades organizativas, gusto, verificación, seguimiento de instrucciones y epistémica". En otras palabras, todo lo que hace que RSI realmente funcione.
El Centro de Seguridad y Tecnología Emergente de Georgetown reunió a expertos el año pasado y encontró una gran división: algunos esperaban una explosión inminente de "superinteligencia", otros un progreso más lento y una meseta. Helen Toner, directora de CSET y exmiembro de la junta de OpenAI, aclaró que usar herramientas de IA para investigación no califica como RSI. "Solo están usando IA tanto como pueden", dijo. "RSI es realmente que no se necesitan humanos".
Ayeja Cotra de METR estableció hitos: "adecuación" (la IA puede investigar sin humanos, aunque sea mal), "paridad" (la IA iguala a los humanos) y "supremacía" (la IA supera la colaboración humano-IA). Ella cree que la adecuación podría llegar en un par de años, pero la paridad es más turbia. Una vez que llegue la paridad, predice la supremacía dentro de otro año.
Toner traza un paralelo histórico: "Pasamos de lenguajes de máquina a lenguaje ensamblador y lenguajes compilados; te estás alejando de las entrañas de la computadora. Pero el humano todavía, en algún sentido intuitivo, está al mando". Ir más allá de ese paradigma requiere resolver