OpenAI ChatGPT Images 2.0: Finalmente lo suficientemente bueno para trabajo real, no solo para hacer que tu gato parezca un Papa del Renacimiento

OpenAI ChatGPT Images 2.0 ahora puede generar infografías con texto y logotipos correctos, pero todavía inventa empresas falsas y calificaciones de estrellas equivocadas, así que básicamente está listo para mandos intermedios.

A principios de esta semana, OpenAI presentó ChatGPT Images 2.0, su nuevo motor de generación de imágenes. Clave en este lanzamiento es un salto en funcionalidad de crear "decoraciones" (término de OpenAI) a gráficos de página completa, incluyendo texto detallado.

Tuve acceso temprano a una versión previa al lanzamiento. Funcionaba bastante bien, pero seguía equivocándose con el logotipo de ZDNET. Ahora que el producto se ha lanzado oficialmente, lo estoy probando a fondo con una amplia gama de desafíos.

Images 2.0 está disponible para todos los niveles de ChatGPT, pero las funciones de lenguaje más capaces solo están disponibles para niveles de pago que pueden usar el modelo Thinking. Estoy ejecutando todas estas pruebas usando una cuenta de ChatGPT Plus con Thinking activado.

Comencemos con los ejercicios de marca de ZDNET. En lugar de simplemente subir páginas de ZDNET y hacer que encuentre el logotipo en la página, creé una imagen independiente del logotipo de ZDNET y la subí con cada indicación. Eso pareció ayudar enormemente. [Una nota rápida: ZDNET no permite que OpenAI raspe sus páginas. Ziff Davis, la empresa matriz de ZDNET, presentó una demanda en abril de 2025 contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis en el entrenamiento y operación de sus sistemas de IA. Así que usé una extensión de Chrome para capturar capturas de pantalla completas de los artículos que quería probar con Images 2.0. Así es como ChatGPT pudo leerlos.]

Mi punto de partida fue el artículo que escribí anteriormente sobre Images 2.0. Le di a ChatGPT esta indicación: "Crea una infografía detallada y vívida de este artículo usando el estilo de marca de ZDNET y el logotipo de ZDNET adjunto." No solo el logotipo es correcto, sino que la coloración es perfecta para ZDNET. Pero donde realmente brilla la imagen es en su uso de texto. Todo el texto es correcto, incluso el texto pequeño en ángulo en la imagen.

A continuación, decidí retomar el desafío de sketchnotes que le di a Google Nano Banana hace unos meses. La tarea en ese momento era crear una versión de sketchnotes de la Carta de Derechos de EE. UU. Nano Banana hizo un gran trabajo con las imágenes, pero tuve que intentar una y otra (y otra) vez para convencerlo de que escribiera bien el texto. Para ChatGPT Images 2.0, subí la apuesta ligeramente. Quería sketchnotes, pero los quería en el estilo de marca de ZDNET. Aquí está la primera indicación: "Hazme un sketchnote de la Carta de Derechos de EE. UU. Usa el estilo del logotipo de ZDNET y haz los sketchnotes en el estilo de ZDNET." Esa es la imagen de la izquierda. Aquí está la segunda indicación: "Incluye el logotipo de ZDNET y agrega más colores de estilo neón, quizás sobre un fondo negro." Esa es la imagen de la derecha. Primero, nota que el texto es correcto. No hay duplicados. No falta nada. Ya está muy por encima del rendimiento de Nano Banana. Ambas versiones encajan con el estilo de ZDNET. Lo único que no me entusiasma es que el logotipo de ZDNET parece metido a la fuerza en la segunda imagen. Aun así, el logotipo es correcto, y probablemente podría hacer algunos pases más de indicaciones para colocarlo mejor.

Pero ahora llegamos al error no forzado que reveló mi conjunto de pruebas. Le pedí a Images 2.0 que convirtiera mi artículo de comparación de constructores de sitios web con IA en una infografía. Produjo una infografía bastante utilizable, aunque algo recargada. Incluso fue a internet y agregó información que no tenía en el artículo, como precios base. Sin embargo, también agregó algunos errores fácticos: las calificaciones de estrellas eran incorrectas, una descripción de producto era incorrecta, e inventó una empresa llamada "AI Builders" que no existe. Para ser justos, todos estos son errores que un diseñador gráfico humano interno podría producir en un primer borrador. Cuando volví a indicar a Images 2.0 con correcciones (excepto las calificaciones de estrellas, que no corregí en la segunda imagen), modificó correctamente la infografía con información más apropiada.

Este lanzamiento de Images 2.0 es una gran mejora con respecto a versiones anteriores. La versión de ChatGPT Images que vi el año pasado fue impresionante, especialmente para recontextualizar imágenes. Esta nueva versión, que puede interpretar contenido real y luego crear imágenes, es un gran salto con respecto a las versiones anteriores. Más al punto, puede ofrecer

OpenAI ChatGPT Images 2.0: Finalmente lo suficientemente bueno para trabajo real, no solo para hacer que tu gato parezca un Papa del Renacimiento

Noticias en tu bandeja.