All'inizio di questa settimana, OpenAI ha svelato ChatGPT Images 2.0, il suo nuovo motore di generazione immagini. La novità principale è un salto di funzionalità: da creare "decorazioni" (termine di OpenAI) a grafiche a pagina intera, inclusi testi dettagliati.
Ho avuto accesso anticipato a una versione pre-release. Funzionava abbastanza bene, ma continuava a sbagliare il logo di ZDNET. Ora che il prodotto è stato rilasciato ufficialmente, lo sto testando a fondo su una vasta gamma di sfide.
Images 2.0 è disponibile per tutti i livelli di ChatGPT, ma le funzionalità linguistiche più avanzate sono riservate ai piani a pagamento che possono usare il modello Thinking. Eseguo tutti questi test con un account ChatGPT Plus con Thinking attivato.
Iniziamo con gli esercizi di branding ZDNET. Invece di caricare semplicemente pagine ZDNET e fargli trovare il logo sulla pagina, ho creato un'immagine standalone del logo ZDNET e l'ho caricata con ogni prompt. Questo ha aiutato enormemente. [Una nota rapida: ZDNET non permette a OpenAI di fare scraping delle sue pagine. Ziff Davis, la società madre di ZDNET, ha intentato una causa nell'aprile 2025 contro OpenAI, sostenendo che abbia violato i copyright di Ziff Davis nell'addestramento e nell'operatività dei suoi sistemi AI. Quindi ho usato un'estensione Chrome per catturare screenshot a schermo intero degli articoli che volevo testare con Images 2.0. È così che ChatGPT è stato in grado di leggerli.]
Il mio punto di partenza è stato l'articolo che avevo scritto in precedenza su Images 2.0. Ho dato a ChatGPT questo prompt: "Crea un'infografica dettagliata e vivida di questo articolo usando lo stile del brand ZDNET e il logo ZDNET allegato." Non solo il logo è corretto, ma la colorazione è perfetta per ZDNET. Ma dove l'immagine brilla davvero è nell'uso del testo. Tutto il testo è corretto, anche il testo minuscolo inclinato nell'immagine.
Successivamente, ho deciso di rivisitare la sfida degli sketchnote che avevo dato a Google Nano Banana qualche mese fa. Allora il compito era creare una versione sketchnote della Carta dei Diritti degli Stati Uniti. Nano Banana ha fatto un ottimo lavoro con le immagini, ma ho dovuto provare e riprovare (e riprovare) per convincerlo a ottenere le parole giuste. Per ChatGPT Images 2.0, ho alzato leggermente la posta. Volevo sketchnote, ma li volevo nello stile del brand ZDNET. Ecco il primo prompt: "Fammi uno sketchnote della Carta dei Diritti degli Stati Uniti. Usa lo stile del logo ZDNET e realizza gli sketchnote nello stile ZDNET." Quella è l'immagine a sinistra. Ecco il secondo prompt: "Includi il logo ZDNET e aggiungi più colori stile neon, magari su sfondo nero." Quella è l'immagine a destra. Prima di tutto, notate che il testo è corretto. Non ci sono duplicati. Non manca nulla. Già questo è molto superiore alla performance di Nano Banana. Entrambe le versioni si adattano allo stile di ZDNET. L'unica cosa che non mi entusiasma è che il logo ZDNET sembra incastrato nella seconda immagine. Anche così, il logo è corretto, e potrei probabilmente fare qualche altro passaggio di prompt per posizionarlo meglio.
Ma ora arriviamo all'errore non forzato che il mio test ha rivelato. Ho chiesto a Images 2.0 di convertire il mio articolo di confronto tra costruttori di siti web AI in un'infografica. Ha prodotto un'infografica abbastanza utilizzabile, anche se un po' affollata. Ha persino cercato su internet e aggiunto informazioni che non avevo nell'articolo, come i prezzi base. Tuttavia, ha anche aggiunto alcuni errori fattuali: le valutazioni a stelle erano sbagliate, una descrizione del prodotto era errata, e ha inventato una società chiamata "AI Builders" che non esiste. Per essere onesti, sono tutti errori che un grafico umano interno potrebbe produrre in una prima bozza. Quando ho ripetuto il prompt con correzioni (tranne che per le valutazioni a stelle, che non ho corretto nella seconda immagine), ha modificato correttamente l'infografica con informazioni più appropriate.
Questo rilascio di Images 2.0 è un enorme miglioramento rispetto alle versioni precedenti. La versione di ChatGPT Images che ho visto l'anno scorso era impressionante, specialmente per ricontestualizzare le immagini. Questa nuova versione, che può interpretare il contenuto reale e poi creare immagini, è un salto enorme rispetto alle build precedenti. Per essere più precisi, può fornire