En febrero, este reportero recogió un volante en una marcha anti-IA en Londres. Decía, en lo que podría o no haber sido un homenaje deliberado a los gnomos de los calzoncillos de South Park: "Paso 1: Crear una supermente digital. Paso 2: ? Paso 3: ?". Producido por Pause AI, un grupo activista que coorganizó la protesta, el volante terminaba con una súplica: "Pausa la IA hasta que sepamos qué demonios es el Paso 2".
La referencia, para los no iniciados, es al episodio de 1998 de South Park en el que Kenny, Kyle, Cartman y Stan descubren gnomos cuyo plan de negocios es "Fase 1: Recolectar calzoncillos. Fase 2: ? Fase 3: Beneficio". Desde entonces, el meme se ha utilizado para satirizar desde estrategias de startups hasta el plan de financiación de la misión a Marte de Elon Musk. Ahora mismo, captura perfectamente el estado de la IA: Las empresas han construido la tecnología (Paso 1) y han prometido transformación (Paso 3). Cómo llegar allí sigue siendo un gran signo de interrogación.
Pause AI cree que el Paso 2 debe implicar regulación, aunque exactamente cómo se ve eso y quién lo aplica está en debate. Los impulsores de la IA, mientras tanto, están convencidos de que el Paso 3 es la salvación y tienden a saltarse la parte intermedia por completo. El científico jefe de OpenAI, Jakub Pachocki, describió la IA como una "tecnología económicamente transformadora", con las soleadas tierras altas aparentemente justo en el horizonte. Pero cada uno toma una ruta diferente, y es una incógnita quién lo logrará.
Por cada gran afirmación sobre el futuro, hay una verificación de realidad aleccionadora. Considera dos estudios recientes. Uno de Anthropic predijo qué trabajos afectarán más los LLM: gerentes, arquitectos y tipos de medios deben prepararse para el cambio; jardineros, trabajadores de la construcción y personal de hostelería, no tanto. Pero estas predicciones son realmente solo conjeturas basadas en lo que los LLM parecen buenos, no en cómo se desempeñan realmente en el lugar de trabajo.
Otro estudio de febrero de investigadores de Mercor, una startup de contratación de IA, probó varios agentes de IA impulsados por modelos de primer nivel de OpenAI, Anthropic y Google DeepMind en 480 tareas laborales realizadas rutinariamente por banqueros, consultores y abogados humanos. Cada agente falló en completar la mayoría de sus deberes.
¿Por qué tal desacuerdo general? Para empezar, considera quién hace las afirmaciones y por qué: Anthropic tiene intereses creados. La mayoría de las personas que nos dicen que algo grande está por suceder basan eso en lo rápido que mejoran las herramientas de codificación de IA. Pero no todas las tareas se pueden hackear con codificación. Otros estudios encuentran que los LLM son malos en juicios estratégicos.
Además, las herramientas no se colocan en salas limpias. Deben funcionar en lugares contaminados con personas y flujos de trabajo existentes, y a veces añadir IA empeora las cosas. Claro, tal vez esos flujos de trabajo necesitan ser desgarrados y reformados en torno a la nueva tecnología, pero eso lleva tiempo y agallas.
¿Ese gran agujero? Está justo donde debería estar el Paso 2. La falta de acuerdo sobre lo que está por suceder y cómo crea un vacío de información llenado por la última afirmación descabellada de la semana, las pruebas al diablo. Estamos tan desvinculados de cualquier comprensión real que una sola publicación en redes sociales puede sacudir los mercados.
Necesitamos menos conjeturas y más evidencia. Eso requiere transparencia de los fabricantes de modelos, coordinación entre investigadores y empresas, y nuevas formas de evaluar esta tecnología en el mundo real. La industria tecnológica, y con ella la economía mundial, descansa en la promesa de que la IA será transformadora. Pero eso aún no es una apuesta segura. La próxima vez que escuches afirmaciones audaces, recuerda: la mayoría de las empresas todavía están descubriendo qué hacer con sus calzoncillos.