La începutul acestei săptămâni, OpenAI a dezvăluit ChatGPT Images 2.0, noul său motor de generare a imaginilor. Elementul cheie al acestei lansări este un salt în funcționalitate, de la crearea de „decorațiuni” (termenul OpenAI) la grafice pe pagină întreagă, inclusiv text detaliat.
Am avut acces timpuriu la o versiune pre-lansare. A funcționat destul de bine, dar tot greșea logo-ul ZDNET. Acum că produsul a fost lansat oficial, îl testez în profunzime pe o gamă largă de provocări.
Images 2.0 este disponibil pentru toate nivelurile ChatGPT, dar funcțiile lingvistice mai capabile sunt disponibile doar pentru nivelurile plătite care pot folosi modelul Thinking. Rulez toate aceste teste folosind un cont ChatGPT Plus cu Thinking activat.
Să începem cu exercițiile de branding ZDNET. În loc să încarc doar pagini ZDNET și să las sistemul să găsească logo-ul pe pagină, am creat o imagine separată a logo-ului ZDNET și am încărcat-o cu fiecare prompt. Asta părea să ajute enorm. [O notă rapidă: ZDNET nu permite OpenAI să-i acceseze paginile. Ziff Davis, compania-mamă a ZDNET, a intentat un proces în aprilie 2025 împotriva OpenAI, acuzând-o că a încălcat drepturile de autor Ziff Davis în antrenarea și operarea sistemelor sale AI. Așa că am folosit o extensie Chrome pentru a captura capturi de ecran pe ecran întreg ale articolelor pe care voiam să le testez cu Images 2.0. Așa a putut ChatGPT să le citească.]
Punctul meu de plecare a fost articolul pe care l-am scris anterior despre Images 2.0. Am alimentat ChatGPT cu acest prompt: „Creează o infografică detaliată și vie a acestui articol folosind stilul de brand ZDNET și logo-ul ZDNET atașat.” Nu numai că logo-ul este corect, dar colorarea este perfectă pentru ZDNET. Dar unde imaginea strălucește cu adevărat este utilizarea textului. Tot textul este corect, chiar și textul mic înclinat din imagine.
Apoi, am decis să revizuiesc provocarea sketchnotes pe care am dat-o lui Google Nano Banana acum câteva luni. Sarcina de atunci era să creez o versiune sketchnotes a Declarației de Drepturi a SUA. Nano Banana a făcut o treabă grozavă cu imaginile, dar a trebuit să încerc iar și iar (și iar) să-l conving să scrie corect textul. Pentru ChatGPT Images 2.0, am crescut puțin miza. Voiam sketchnotes, dar le voiam în stilul de branding ZDNET. Iată primul prompt: „Fă-mi un sketchnote al Declarației de Drepturi a SUA. Folosește stilul logo-ului ZDNET și fă sketchnotes în stilul ZDNET.” Aceasta este imaginea din stânga. Iată al doilea prompt: „Include logo-ul ZDNET și adaugă mai multe culori în stil neon, poate pe un fundal negru.” Aceasta este imaginea din dreapta. În primul rând, observați că textul este corect. Nu există duplicate. Nimic nu lipsește. Deja, acest lucru este cu cap și umeri deasupra performanței Nano Banana. Ambele versiuni se potrivesc cu stilul ZDNET. Singurul lucru de care nu sunt încântat este că logo-ul ZDNET pare înghesuit în a doua imagine. Chiar și așa, logo-ul este corect și aș putea face câteva încercări suplimentare de prompt pentru a-l plasa mai bine.
Dar acum ajungem la eroarea neforțată pe care testarea mea a dezvăluit-o. Am cerut Images 2.0 să transforme articolul meu despre confruntarea constructorilor de site-uri AI într-o infografică. A produs o infografică destul de utilizabilă, deși oarecum aglomerată. A mers chiar și pe internet și a adăugat informații pe care nu le aveam în articol, cum ar fi prețurile de bază. Cu toate acestea, a adăugat și câteva erori faptice: evaluările cu stele erau greșite, o descriere a produsului era incorectă și a inventat o companie numită „AI Builders” care nu există. Pentru a fi corect, acestea sunt toate erori pe care un designer grafic uman intern le-ar putea produce într-o primă schiță. Când am re-promptat Images 2.0 cu corecții (cu excepția evaluărilor cu stele, pe care nu le-am corectat în a doua imagine), a modificat corect infografica cu informații mai potrivite.
Această lansare Images 2.0 este o îmbunătățire uriașă față de versiunile anterioare. Versiunea ChatGPT Images pe care am analizat-o anul trecut era impresionantă, mai ales pentru recontextualizarea imaginilor. Această nouă versiune, care poate interpreta conținut real și apoi crea imagini, este un salt uriaș față de versiunile anterioare. Mai exact, poate livra