Plus tôt cette semaine, OpenAI a dévoilé ChatGPT Images 2.0, son nouveau moteur de génération d'images. L'élément clé de cette version est un bond en avant en termes de fonctionnalités, passant de la création de « décorations » (terme d'OpenAI) à des graphiques pleine page, y compris du texte détaillé.

J'ai eu un accès anticipé à une version de pré-lancement. Cela fonctionnait plutôt bien, mais le logo ZDNET était systématiquement mal rendu. Maintenant que le produit est officiellement sorti, je le teste en profondeur sur une série de défis variés.

Images 2.0 est disponible pour tous les niveaux de ChatGPT, mais les fonctionnalités linguistiques les plus avancées ne sont accessibles qu'aux abonnés payants pouvant utiliser le modèle Thinking. J'effectue tous ces tests avec un compte ChatGPT Plus avec Thinking activé.

Commençons par les exercices de branding ZDNET. Plutôt que de simplement télécharger des pages ZDNET et de lui demander de trouver le logo sur la page, j'ai créé une image autonome du logo ZDNET et je l'ai téléchargée avec chaque prompt. Cela a semblé aider énormément. [Note rapide : ZDNET n'autorise pas OpenAI à scraper ses pages. Ziff Davis, la société mère de ZDNET, a déposé une plainte en avril 2025 contre OpenAI, l'accusant d'avoir violé les droits d'auteur de Ziff Davis dans l'entraînement et l'exploitation de ses systèmes d'IA. J'ai donc utilisé une extension Chrome pour capturer des captures d'écran plein écran des articles que je voulais tester avec Images 2.0. C'est ainsi que ChatGPT a pu les lire.]

Mon point de départ était l'article que j'avais précédemment écrit sur Images 2.0. J'ai donné ce prompt à ChatGPT : « Crée une infographie détaillée et vivante de cet article en utilisant le style de la marque ZDNET et le logo ZDNET joint. » Non seulement le logo est correct, mais le coloriage est parfait pour ZDNET. Mais là où l'image brille vraiment, c'est dans l'utilisation du texte. Tout le texte est correct, même le petit texte en angle dans l'image.

Ensuite, j'ai décidé de revisiter le défi des sketchnotes que j'avais donné à Google Nano Banana il y a quelques mois. La mission à l'époque était de créer une version sketchnote de la Déclaration des droits des États-Unis. Nano Banana a fait un excellent travail avec les images, mais j'ai dû essayer encore et encore (et encore) pour le convaincre de bien orthographier le texte. Pour ChatGPT Images 2.0, j'ai légèrement relevé la barre. Je voulais des sketchnotes, mais dans le style de la marque ZDNET. Voici le premier prompt : « Fais-moi un sketchnote de la Déclaration des droits des États-Unis. Utilise le style du logo ZDNET et réalise les sketchnotes dans le style ZDNET. » C'est l'image de gauche. Voici le second prompt : « Inclus le logo ZDNET et ajoute plus de couleurs néon, peut-être sur un fond noir. » C'est l'image de droite. D'abord, remarquez que le texte est correct. Il n'y a pas de doublons. Rien ne manque. Déjà, c'est bien supérieur à la performance de Nano Banana. Les deux versions correspondent au style ZDNET. La seule chose qui ne me plaît pas, c'est que le logo ZDNET semble plaqué sur la deuxième image. Malgré tout, le logo est correct, et je pourrais probablement faire quelques passages de prompt supplémentaires pour mieux le positionner.

Mais nous arrivons maintenant à l'erreur non forcée que mes tests ont révélée. J'ai demandé à Images 2.0 de convertir mon article sur le duel des constructeurs de sites web IA en infographie. Il a produit une infographie assez utilisable, bien que quelque peu chargée. Il est même allé sur Internet et a ajouté des informations que je n'avais pas dans l'article, comme les prix de base. Cependant, il a également ajouté quelques erreurs factuelles : les notes par étoiles étaient fausses, une description de produit était incorrecte, et il a inventé une entreprise appelée « AI Builders » qui n'existe pas. Pour être honnête, ce sont toutes des erreurs qu'un graphiste humain interne pourrait produire dans un premier jet. Lorsque j'ai relancé Images 2.0 avec des corrections (sauf pour les notes par étoiles, que je n'ai pas corrigées dans la deuxième image), il a correctement modifié l'infographie avec des informations plus appropriées.

Cette version d'Images 2.0 est une énorme amélioration par rapport aux versions précédentes. La version de ChatGPT Images que j'avais examinée l'année dernière était impressionnante, surtout pour la recontextualisation d'images. Cette nouvelle version, qui peut interpréter le contenu réel puis créer des images, est un bond énorme par rapport aux versions précédentes. Plus important encore, elle peut fournir