OpenAI:s ChatGPT Images 2.0: Äntligen tillräckligt bra för verkligt arbete, inte bara för att få din katt att se ut som en renässanspåve

OpenAI:s ChatGPT Images 2.0 kan nu generera infografik med korrekt text och logotyper, men hittar fortfarande ibland på påhittade företag och fel stjärnbetyg – så i princip är den redo för mellanchefer.

Tidigare i veckan lanserade OpenAI ChatGPT Images 2.0, sin nya bildgenereringsmotor. Nyckeln i denna lansering är ett hopp i funktionalitet från att skapa "dekorationer" (OpenAI:s term) till helsidesgrafik, inklusive detaljerad text.

Jag hade tidig tillgång till en förhandsversion. Den fungerade ganska bra, men krånglade hela tiden med ZDNET-logotypen. Nu när produkten har släppts officiellt testar jag den på djupet över en rad utmaningar.

Images 2.0 är tillgänglig för alla ChatGPT-nivåer, men de mer kapabla språkfunktionerna är endast tillgängliga för betalnivåer som kan använda Thinking-modellen. Jag kör alla dessa tester med ett ChatGPT Plus-konto med Thinking aktiverat.

Låt oss börja med ZDNET:s varumärkesövningar. Istället för att bara ladda upp ZDNET-sidor och låta den hitta logotypen på sidan, skapade jag en fristående bild av ZDNET-logotypen och laddade upp den med varje prompt. Det verkade hjälpa enormt. [En snabb notering: ZDNET tillåter inte OpenAI att skrapa sina sidor. Ziff Davis, ZDNET:s moderbolag, lämnade in en stämningsansökan i april 2025 mot OpenAI, där de påstod att OpenAI kränkte Ziff Davis upphovsrätter vid träning och drift av sina AI-system. Så jag använde ett Chrome-tillägg för att ta fullskärmsskärmbilder av artiklarna jag ville testa med Images 2.0. Det var så ChatGPT kunde läsa dem.]

Min utgångspunkt var artikeln jag tidigare skrev om Images 2.0. Jag matade ChatGPT med denna prompt: "Skapa en detaljerad och levande infografik av denna artikel med ZDNET:s varumärkesstil och den bifogade ZDNET-logotypen." Inte bara är logotypen korrekt, utan färgsättningen är perfekt för ZDNET. Men där bilden verkligen lyser är i användningen av text. All text är korrekt, även den lilla texten i vinkel i bilden.

Därefter bestämde jag mig för att återbesöka sketchnotes-utmaningen jag gav Googles Nano Banana för några månader sedan. Uppgiften då var att skapa en sketchnotes-version av USA:s Bill of Rights. Nano Banana gjorde ett bra jobb med bilderna, men jag var tvungen att försöka om och om (och om) igen för att övertyga den om att få texten rätt. För ChatGPT Images 2.0 höjde jag insatserna något. Jag ville ha sketchnotes, men jag ville ha dem i ZDNET:s varumärkesstil. Här är första prompten: "Gör mig en sketchnote av USA:s Bill of Rights. Använd ZDNET-logotypens stil och gör sketchnotes i ZDNET-stil." Det är bilden till vänster. Här är andra prompten: "Inkludera ZDNET-logotypen och lägg till fler neonfärger, kanske på en svart bakgrund." Det är bilden till höger. För det första, notera att texten är korrekt. Det finns inga dubbletter. Ingenting saknas. Redan nu är detta huvud och axlar över Nano Bananas prestation. Båda versionerna passar ZDNET:s stil. Det enda jag inte är helt nöjd med är att ZDNET-logotypen ser instoppad ut på den andra bilden. Ändå är logotypen korrekt, och jag skulle förmodligen kunna göra några fler prompt-pass för att få den bättre placerad.

Men nu kommer vi till det onödiga misstaget som min testning avslöjade. Jag bad Images 2.0 konvertera min artikel om AI-webbplatsbyggare till en infografik. Den producerade en ganska användbar, om än något rörig, infografik. Den gick till och med ut på internet och lade till information som jag inte hade i artikeln, som baspriser. Men den lade också till några faktiska fel: stjärnbetygen var fel, en produktbeskrivning var felaktig, och den hittade på ett företag som heter "AI Builders" som inte existerar. För att vara rättvis är detta alla fel som en mänsklig grafisk formgivare på företaget skulle kunna producera i ett första utkast. När jag promptade om Images 2.0 med korrigeringar (förutom stjärnbetygen, som jag inte korrigerade i den andra bilden), modifierade den korrekt infografiken med mer lämplig information.

Denna Images 2.0-lansering är en enorm förbättring jämfört med tidigare versioner. Den ChatGPT Images-version jag tittade på förra året var imponerande, särskilt för att omkontextualisera bilder. Denna nya version, som kan tolka verkligt innehåll och sedan skapa bilder, är ett enormt steg framåt jämfört med tidigare byggen. Mer relevant är att den kan leverera.

OpenAI:s ChatGPT Images 2.0: Äntligen tillräckligt bra för verkligt arbete, inte bara för att få din katt att se ut som en renässanspåve

Nyheter i din inkorg.