In der vergangenen Woche hat sich ZDNet-Autor David Gewirtz mit der neuen Veröffentlichung von OpenAI, ChatGPT Images 2.0, beschäftigt, die seiner Meinung nach eine viel bedeutendere Veröffentlichung ist, als es zunächst den Anschein hat. Wir waren alle beeindruckt von KI-Bildgeneratoren – sie machen hübsche Bilder, führen lustige Tricks aus und produzieren eine Menge KI-Schrott. Aber bisher war ihr Verständnis dessen, was sie produzieren, begrenzt. Images 2.0 fügt der Bildgenerierung Fachwissen hinzu, was bedeutet, dass ChatGPT jetzt Aufgaben erhalten und hochwertige Ergebnisse liefern kann – wie zum Beispiel die Neugestaltung der Benutzeroberfläche Ihrer App, ohne dass sie wie eine GeoCities-Seite von 1998 aussieht.

Gewirtz fütterte zwei UI-Designs, an denen er aktiv arbeitet, in ChatGPT Images 2.0 auf seinem 20-Dollar-pro-Monat-ChatGPT-Plus-Plan. In wenigen Minuten gab ChatGPT zwei neu gestaltete Benutzeroberflächen zurück, die beide zu einer ganzen Reihe von Designverbesserungen führten, die er in seine Produkte einbauen will. Die erste war eine Mac-App, an der er seit Januar mit Claude Code herumcodiert – ein Projekt, das eine Weile dauert, weil er nur ein oder zwei Stunden pro Woche daran arbeiten kann, und das die interne KI von macOS zur Bildverarbeitung und -analyse nutzt. Er lud einen Screenshot hoch und forderte die KI auf: „Gestalten Sie diese Benutzeroberfläche neu, um sie attraktiver und benutzerfreundlicher zu machen.“ Zuerst gefielen ihm die Änderungen nicht – die offensichtlichste Änderung war der Verlust der farbigen Schaltflächen, und die KI verstand nicht ganz, dass es am unteren Rand der Rasteransicht Anzeigeoptionen gibt. Aber andererseits enthielt der neue Entwurf fünf Designnotizen, die er einbauen will, und ein Entwurf macht es viel einfacher, Claude Code zu zeigen, was er tun soll.

Als nächstes kam die UI für die Startseite seines Sicherheitsprodukts. Sein Design war sauber, aber ziemlich rudimentär, was hauptsächlich darauf zurückzuführen ist, dass er es hasst, in CSS zu codieren. Letzten Herbst, in seinem allerersten agentenbasierten Vibe-Coding-Projekt, verwendete er OpenAIs Codex in seinem ChatGPT-Plus-Plan, um die UI von ziemlich hässlich zu akzeptabel umzugestalten. Dieses Mal fügte er den Screenshot in ChatGPT ein, drückte aber versehentlich die Eingabetaste, bevor er eine Eingabeaufforderung geben konnte. ChatGPT entschied von selbst, die Seite zu analysieren, und folgerte: „Die größten Probleme sind schwache visuelle Hierarchie, zu viel Grau, ein sehr langer Einleitungsblock und drei untere Karten, die gleich stark um Aufmerksamkeit konkurrieren, obwohl sie nicht gleich wichtig sind.“ Es empfahl auch eine „modernere Admin-Ästhetik“. Gewirtz wies es dann an: „Geben Sie mir ein Bild der neu definierten Oberfläche“, und die KI produzierte ein Design, das ein Logo erfand (hauptsächlich, weil er keins bereitgestellt hatte) und mehrere Funktionen hinzufügte, die ihm gefielen, darunter einen Quick-Setup-Bereich, einen Need-Help-Bereich, einen Configure Privacy/View Docs-Abschnitt und einen Site-Status-Abschnitt unten.

Gewirtz ist der Meinung, dass diese Fähigkeit ebenso bahnbrechend ist wie ChatGPT, als es zum ersten Mal herauskam, und wie agentisches Pair Programming, als es letzten Sommer auf den Markt kam. Er reichte zwei Produkt-Benutzeroberflächen bei der KI ein und erhielt im Wesentlichen Peer-Review-Kommentare zusammen mit einer Reihe von Prototyp-Designs. Als Solo-Programmierer ist dieser Output unbezahlbar – selbst wenn er ein komplettes internes Team mit Programmierern und Designern hätte, hätte es wahrscheinlich etwa eine Woche gedauert, diese Analyse durchzuführen und Prototypen zur Überprüfung zu erstellen. Allein die Gehaltskosten für dieses Projekt wären ziemlich hoch gewesen. Aber für 20 Dollar bekam er zwei sehr hilfreiche, sehr konstruktive und überhaupt nicht KI-dumme Neugestaltungen, die umsetzbare Nuggets enthielten, die seine Produkte besser machen werden.