Un estudio que declaró con confianza que ChatGPT de OpenAI puede mejorar el aprendizaje de los estudiantes ha sido retractado, aproximadamente un año después de su publicación, después de que Springer Nature detectara "discrepancias" en el análisis y perdiera la fe en sus conclusiones. No es que al artículo le importara: ya había acumulado cientos de citas y disfrutado de una gloriosa vuelta por las redes sociales antes de que le cortaran el enchufe.
"Los autores del artículo hicieron afirmaciones muy llamativas sobre los beneficios de ChatGPT en los resultados de aprendizaje", dijo Ben Williamson, profesor titular del Centro de Investigación en Educación Digital y del Instituto de Futuros de Edimburgo de la Universidad de Edimburgo, en un correo electrónico a Ars. "Fue tratado por muchos en redes sociales como una de las primeras piezas de evidencia sólida y de estándar de oro de que ChatGPT, y la IA generativa en general, beneficia a los estudiantes".
El artículo retractado pretendía cuantificar "el efecto de ChatGPT en el rendimiento académico, la percepción del aprendizaje y el pensamiento de orden superior" analizando los resultados de 51 estudios anteriores. Su metaanálisis calculó los tamaños del efecto entre grupos experimentales que usaron ChatGPT y grupos de control que no lo hicieron, mostrando supuestamente "un gran impacto positivo en la mejora del rendimiento académico" junto con "un impacto moderadamente positivo en la mejora de la percepción del aprendizaje" y "el fomento del pensamiento de orden superior". Los hallazgos aparecieron por primera vez en Humanities & Social Sciences Communications el 6 de mayo de 2025.
Williamson señaló que el artículo parecía "sintetizar estudios de muy baja calidad, o mezclar hallazgos de estudios que simplemente no se pueden comparar con precisión debido a métodos, poblaciones y muestras muy diferentes". También cuestionó el momento: apenas dos años y medio después del lanzamiento de ChatGPT en noviembre de 2022. "No es factible que se hayan realizado, revisado y publicado docenas de estudios de alta calidad sobre ChatGPT y rendimiento académico en ese tiempo", dijo.
Desde su publicación, el estudio fue citado 262 veces en revistas revisadas por pares de Springer Nature y 504 veces en total, atrajo a casi medio millón de lectores y obtuvo el percentil 99 en atención. "Todos los detalles del estudio se eliminaron", lamentó Williamson. "Solo quedaron las afirmaciones principales, que ciertos usuarios de redes sociales ayudaron a impulsar y propagar".
Ilkka Tuomi, científico jefe de Meaning Processing Ltd., había advertido en LinkedIn sobre los metaanálisis que intentan "sacar conclusiones sobre resultados incompatibles y mal definidos" de diferentes poblaciones. "La única razón para hacer estos estudios parece ser que las herramientas de estadística y metaanálisis pueden generar números que parecen ciencia", escribió Tuomi.
El 22 de abril de 2026, Springer Nature publicó un aviso de retractación señalando "preocupaciones sobre discrepancias en el metaanálisis" y que "los autores no habían respondido a la correspondencia sobre la retractación". Williamson compartió el aviso en Bluesky y LinkedIn, preocupado de que muchos lectores se perdieran la retractación y de que "el hallazgo principal de que ChatGPT ayuda al rendimiento académico podría persistir a pesar de su retractación".
"Todo esto es enormemente frustrante para aquellos de nosotros que intentamos entender qué significa la IA para el aprendizaje, la enseñanza y la educación en general", dijo Williamson a Ars. "Hemos tenido varios años de hype sobre la IA en educación, pero lo que realmente necesitamos es investigación de alta calidad que pueda mostrarnos qué tipo de impactos está teniendo la IA en las aulas y las prácticas de aprendizaje".
Mientras tanto, los educadores se apresuran a prevenir el engaño habilitado por IA, las empresas tecnológicas promueven chatbots en "modo estudio" y herramientas de práctica para el SAT, y al menos un país está reintroduciendo libros físicos y aprendizaje con papel y lápiz. Pero oye, un metaanálisis retractado dijo que ChatGPT es genial, así que ¿quién necesita evidencia?