La semaine dernière, David Gewirtz de ZDNet a exploré la nouvelle version ChatGPT Images 2.0 d'OpenAI, qu'il considère comme une version bien plus conséquente qu'il n'y paraît. Nous avons tous été impressionnés par les générateurs d'images IA - ils font de jolies images, des tours amusants, et produisent beaucoup de déchets IA. Mais jusqu'à présent, leur compréhension de ce qu'ils produisent était limitée. Images 2.0 ajoute une intelligence thématique à la génération d'images, ce qui signifie que ChatGPT peut désormais recevoir des missions et produire des résultats de grande valeur - comme, par exemple, redessiner l'interface utilisateur de votre application sans lui donner l'air d'une page GeoCities de 1998.
Gewirtz a soumis deux designs d'UI sur lesquels il travaille activement à ChatGPT Images 2.0 via son abonnement ChatGPT Plus à 20$/mois. En quelques minutes, ChatGPT a renvoyé deux interfaces utilisateur redessinées, toutes deux contenant un tas d'améliorations de design qu'il prévoit d'intégrer à ses produits. La première était une app Mac sur laquelle il code en mode vibe avec Claude Code depuis janvier - un projet qui prend du temps car il n'a qu'une heure ou deux par semaine pour y travailler, et qui utilise l'IA interne de macOS pour le traitement et l'analyse d'images. Il a téléchargé une capture d'écran et a demandé à l'IA de "Redessiner cette interface utilisateur pour la rendre plus attrayante et plus facile à utiliser." Au début, il n'a pas aimé les modifications - le changement le plus évident était la perte des boutons colorés, et l'IA n'a pas bien compris qu'il y a des options d'affichage en bas de la vue en grille. Mais d'un autre côté, la nouvelle maquette incluait cinq notes de design qu'il prévoit d'intégrer, et avoir une maquette facilite grandement la démonstration à Claude Code de ce qu'il veut.
Ensuite, il y avait l'UI de la page de démarrage de son produit de sécurité. Son design était propre mais assez rudimentaire, reflétant surtout le fait qu'il n'aime pas coder en CSS. L'automne dernier, lors de son tout premier projet de codage en mode vibe basé sur des agents, il avait utilisé Codex d'OpenAI dans son abonnement ChatGPT Plus pour redessiner l'UI de plutôt moche à acceptable. Cette fois, il a collé la capture d'écran dans ChatGPT mais a accidentellement appuyé sur Entrée avant de pouvoir donner une instruction. ChatGPT a décidé tout seul d'analyser la page, déduisant que "Les plus gros problèmes sont une hiérarchie visuelle faible, trop de gris, un bloc d'introduction très long, et trois cartes inférieures qui se disputent également l'attention alors qu'elles ne sont pas également importantes." Il a également recommandé une "esthétique administrative plus moderne." Gewirtz lui a alors demandé de "Me fournir une image de l'interface redéfinie", et l'IA a produit un design qui a inventé un logo (surtout parce qu'il n'en avait pas fourni) et ajouté plusieurs fonctionnalités qu'il a aimées, notamment une zone de configuration rapide, une zone d'aide, une section Configurer la confidentialité/Voir la documentation, et une section Statut du site en bas.
Gewirtz estime que cette capacité est aussi révolutionnaire que ChatGPT l'était à ses débuts, et que le codage en mode vibe agentique l'était lorsqu'il est apparu l'été dernier. Il a soumis deux interfaces utilisateur de produits à l'IA et a reçu essentiellement des commentaires de pairs ainsi qu'un ensemble de maquettes de prototypes. En tant que programmeur solo, ce résultat est inestimable - même s'il avait une équipe interne complète avec des programmeurs et des designers, cela aurait probablement pris une semaine environ pour réaliser cette analyse et construire des prototypes à examiner. Les seules dépenses salariales pour ce projet auraient été assez substantielles. Mais pour 20$, on lui a donné deux redesigns très utiles, très constructifs, et pas du tout stupides comme l'IA, contenant des pépites exploitables qui amélioreront ses produits.