Durante la semana pasada, David Gewirtz de ZDNet ha estado explorando el nuevo lanzamiento de OpenAI, ChatGPT Images 2.0, que según él es un lanzamiento mucho más trascendental de lo que parece. Todos hemos quedado impresionados con los generadores de imágenes de IA: hacen imágenes bonitas, hacen trucos divertidos y producen mucha basura de IA. Pero hasta ahora, han tenido una comprensión limitada de lo que están produciendo. Images 2.0 agrega inteligencia temática a la generación de imágenes, lo que significa que ChatGPT ahora puede recibir asignaciones y producir resultados de alto valor, como, por ejemplo, rediseñar la interfaz de usuario de tu aplicación sin que parezca una página de GeoCities de 1998.
Gewirtz alimentó dos diseños de interfaz de usuario en los que está trabajando activamente a ChatGPT Images 2.0 en su plan ChatGPT Plus de $20/mes. En pocos minutos, ChatGPT devolvió dos interfaces de usuario rediseñadas, ambas resultaron en un montón de mejoras de diseño que planea incorporar en sus productos. La primera fue una aplicación para Mac que ha estado "vibe codeando" con Claude Code desde enero, un proyecto que está tomando tiempo porque solo tiene una o dos horas a la semana para trabajar en él, y usa la IA interna de macOS para procesamiento y análisis de imágenes. Subió una captura de pantalla y le pidió a la IA: "Rediseña esta interfaz de usuario para hacerla más atractiva y fácil de usar". Al principio, no le gustaron los cambios: el cambio más obvio fue la pérdida de los botones de colores, y la IA no entendió bien que hay opciones de visualización en la parte inferior de la vista de cuadrícula. Pero por otro lado, el nuevo mockup incluía cinco notas de diseño que planea incorporar, además de que tener un mockup hace que sea mucho más fácil mostrarle a Claude Code lo que quiere que haga.
El siguiente fue la interfaz de la página de inicio de su producto de seguridad. Su diseño era limpio pero bastante rudimentario, reflejando principalmente el hecho de que no le gusta programar en CSS. El otoño pasado, en su primer proyecto de "vibe coding" basado en agentes, usó Codex de OpenAI en su plan ChatGPT Plus para rediseñar la interfaz de bastante fea a no objetable. Esta vez, pegó la captura de pantalla en ChatGPT pero accidentalmente presionó Enter antes de poder darle una instrucción. ChatGPT decidió por su cuenta analizar la página, deduciendo que "Los mayores problemas son una jerarquía visual débil, demasiado gris, un bloque de introducción muy largo y tres tarjetas inferiores que compiten igualmente por la atención aunque no son igualmente importantes". También recomendó una "estética administrativa más moderna". Gewirtz luego le indicó: "Proporcióname una imagen de la interfaz rediseñada", y la IA produjo un diseño que inventó un logotipo (principalmente porque él no había proporcionado uno) y agregó varias características que le gustaron, incluyendo una zona de Configuración Rápida, una zona de Necesita Ayuda, una sección de Configurar Privacidad/Ver Documentos y una sección de Estado del Sitio en la parte inferior.
Gewirtz siente que esta capacidad es tan innovadora como lo fue ChatGPT cuando salió por primera vez, y como lo fue la programación en pareja con agentes cuando llegó el verano pasado. Sometió dos interfaces de usuario de productos a la IA y recibió esencialmente comentarios de revisión por pares junto con un conjunto de diseños prototipo. Como programador solitario, este resultado es invaluable; incluso si tuviera un equipo interno completo con programadores y diseñadores en plantilla, probablemente habría tomado alrededor de una semana realizar este análisis y construir prototipos para revisar. Solo los gastos de nómina para ese proyecto habrían sido bastante sustanciales. Pero por $20, recibió dos rediseños muy útiles, muy constructivos y para nada estúpidos de IA que contenían pepitas procesables que mejorarán sus productos.