Anfang dieser Woche enthüllte OpenAI ChatGPT Images 2.0, seine neue Bildgenerierungs-Engine. Der Schlüssel zu dieser Veröffentlichung ist ein Sprung in der Funktionalität von der Erstellung von „Dekorationen“ (OpenAIs Begriff) hin zu ganzseitigen Grafiken, einschließlich detailliertem Text.

Ich hatte frühen Zugang zu einer Vorabversion. Es funktionierte recht gut, aber es vermasselte ständig das ZDNET-Logo. Jetzt, da das Produkt offiziell veröffentlicht wurde, teste ich es eingehend mit einer breiten Palette von Herausforderungen.

Images 2.0 ist für alle ChatGPT-Stufen verfügbar, aber die leistungsfähigeren Sprachfunktionen sind nur für kostenpflichtige Stufen verfügbar, die das Thinking-Modell nutzen können. Ich führe all diese Tests mit einem ChatGPT Plus-Konto durch, bei dem Thinking aktiviert ist.

Beginnen wir mit den ZDNET-Branding-Übungen. Anstatt nur ZDNET-Seiten hochzuladen und das Logo auf der Seite finden zu lassen, erstellte ich ein eigenständiges Bild des ZDNET-Logos und lud es mit jeder Aufforderung hoch. Das schien enorm zu helfen. [Ein kurzer Hinweis: ZDNET erlaubt OpenAI nicht, seine Seiten zu scrapen. Ziff Davis, die Muttergesellschaft von ZDNET, reichte im April 2025 eine Klage gegen OpenAI ein, in der behauptet wird, OpenAI habe die Urheberrechte von Ziff Davis beim Training und Betrieb seiner KI-Systeme verletzt. Also verwendete ich eine Chrome-Erweiterung, um Vollbild-Screenshots der Artikel zu machen, die ich mit Images 2.0 testen wollte. So konnte ChatGPT sie lesen.]

Mein Ausgangspunkt war der Artikel, den ich zuvor über Images 2.0 geschrieben hatte. Ich gab ChatGPT diese Aufforderung: „Erstelle ein detailliertes und lebendiges Infografik dieses Artikels im ZDNET-Markenstil und mit dem beigefügten ZDNET-Logo.“ Nicht nur das Logo ist korrekt, sondern auch die Farbgebung ist perfekt für ZDNET. Aber wo das Bild wirklich glänzt, ist die Verwendung von Text. Der gesamte Text ist korrekt, sogar der winzige Text in einem Winkel im Bild.

Als nächstes beschloss ich, die Sketchnotes-Herausforderung noch einmal aufzugreifen, die ich vor ein paar Monaten Googles Nano Banana gegeben hatte. Die Aufgabe damals war es, eine Sketchnotes-Version der US-Bill of Rights zu erstellen. Nano Banana machte einen großartigen Job mit den Bildern, aber ich musste immer und immer wieder versuchen, es zu überzeugen, die Formulierung richtig hinzubekommen. Für ChatGPT Images 2.0 erhöhte ich den Einsatz leicht. Ich wollte Sketchnotes, aber im ZDNET-Branding-Stil. Hier ist die erste Aufforderung: „Mach mir eine Sketchnote der US-Bill of Rights. Verwende den ZDNET-Logo-Stil und gestalte die Sketchnotes im ZDNET-Stil.“ Das ist das Bild links. Hier ist die zweite Aufforderung: „Füge das ZDNET-Logo hinzu und füge mehr Neon-Farben hinzu, vielleicht auf schwarzem Hintergrund.“ Das ist das Bild rechts. Beachten Sie zunächst, dass der Text korrekt ist. Es gibt keine Duplikate. Nichts fehlt. Bereits das ist meilenweit besser als Nano Bananas Leistung. Beide Versionen passen zum ZDNET-Stil. Das Einzige, was mich nicht begeistert, ist, dass das ZDNET-Logo im zweiten Bild gequetscht aussieht. Trotzdem ist das Logo korrekt, und ich könnte wahrscheinlich ein paar weitere Aufforderungen durchführen, um es besser zu platzieren.

Aber jetzt kommen wir zu dem unnötigen Fehler, den meine Tests aufdeckten. Ich bat Images 2.0, meinen Artikel über den KI-Website-Builder-Vergleich in ein Infografik umzuwandeln. Es produzierte ein einigermaßen brauchbares, wenn auch etwas überladenes Infografik. Es ging sogar ins Internet und fügte Informationen hinzu, die ich nicht im Artikel hatte, wie Basispreise. Allerdings fügte es auch einige sachliche Fehler hinzu: Die Sternbewertungen waren falsch, eine Produktbeschreibung war falsch, und es erfand ein Unternehmen namens „AI Builders“, das es nicht gibt. Fairerweise muss man sagen, dass dies alles Fehler sind, die ein menschlicher Grafikdesigner im ersten Entwurf machen könnte. Als ich Images 2.0 mit Korrekturen erneut aufforderte (außer den Sternbewertungen, die ich im zweiten Bild nicht korrigierte), modifizierte es das Infografik korrekt mit angemesseneren Informationen.

Diese Veröffentlichung von Images 2.0 ist eine enorme Verbesserung gegenüber früheren Versionen. Die ChatGPT Images-Version, die ich letztes Jahr angesehen habe, war beeindruckend, besonders für die Rekontextualisierung von Bildern. Diese neue Version, die tatsächlichen Inhalt interpretieren und dann Bilder erstellen kann, ist ein riesiger Sprung gegenüber früheren Builds. Um es auf den Punkt zu bringen: Sie kann liefern.