Den senaste veckan har ZDNet:s David Gewirtz pillat på OpenAIs nya ChatGPT Images 2.0-släpp, som han hävdar är ett mycket mer betydelsefullt släpp än det först verkar. Vi har alla imponerats av AI-bildgeneratorer – de gör fina bilder, utför roliga tricks och producerar en massa AI-sörja. Men hittills har de varit begränsade i sin förståelse av vad de producerar. Images 2.0 lägger till ämnesintelligens i bildgenerering, vilket innebär att ChatGPT nu kan ta emot uppdrag och producera högkvalitativa resultat – som till exempel att omdesigna din apps användargränssnitt utan att det ser ut som en GeoCities-sida från 1998.

Gewirtz matade in två UI-designer som han aktivt arbetar med i ChatGPT Images 2.0 på sin $20/månad ChatGPT Plus-plan. På några korta minuter returnerade ChatGPT två omdesignade användargränssnitt, som båda resulterade i en massa designförbättringar han planerar att införliva i sina produkter. Det första var en Mac-app som han har vibe-kodat med Claude Code sedan januari – ett projekt som tar tid eftersom han bara har en timme eller två i veckan att arbeta på det, och det använder macOS interna AI för bildbehandling och analys. Han laddade upp en skärmdump och uppmanade AI:n att "Omdesigna detta användargränssnitt för att göra det mer attraktivt och lättare att använda." Först gillade han inte ändringarna – den mest uppenbara förändringen var förlusten av de färgade knapparna, och AI:n förstod inte riktigt att det finns visningsalternativ längst ner i rutnätsvyn. Men å andra sidan innehöll den nya mockupen fem designanteckningar han planerar att införliva, plus att ha en mockup gör det mycket lättare att visa Claude Code vad han vill att den ska göra.

Näst på tur var gränssnittet för startsidan av hans säkerhetsprodukt. Hans design var ren men ganska rudimentär, mestadels en återspegling av att han ogillar att koda i CSS. Förra hösten, i hans första agentbaserade vibe-kodningsprojekt någonsin, använde han OpenAIs Codex i sin ChatGPT Plus-plan för att omdesigna UI från ganska fult till oantastligt. Den här gången klistrade han in skärmdumpen i ChatGPT men råkade trycka på retur innan han hann ge en uppmaning. ChatGPT bestämde sig på egen hand för att analysera sidan och drog slutsatsen att "De största problemen är svag visuell hierarki, för mycket grått, ett mycket långt introduktionsblock och tre lägre kort som konkurrerar lika mycket om uppmärksamhet trots att de inte är lika viktiga." Det rekommenderade också en "mer modern admin-estetik." Gewirtz instruerade det sedan att "Ge mig en bild av det omdefinierade gränssnittet," och AI:n producerade en design som uppfann en logotyp (mest för att han inte hade tillhandahållit en) och lade till flera funktioner han gillade, inklusive en Quick Setup-zon, en Need Help-zon, en Configure Privacy/View Docs-sektion och en Site Status-sektion längst ner.

Gewirtz anser att denna förmåga är lika banbrytande som ChatGPT var när det först kom ut, och som agentisk parprogrammering var när det landade förra sommaren. Han lämnade in två produktanvändargränssnitt till AI:n och fick i princip peer-reviewed kommentarer tillsammans med en uppsättning prototypdesigner. Som ensam programmerare är denna produktion ovärderlig – även om han hade ett fullt internt team med programmerare och designers på personalen skulle det förmodligen ha tagit ungefär en vecka att genomföra denna analys och konstruera prototyper att granska. Lönekostnaderna enbart för det projektet skulle ha varit ganska betydande. Men för $20 fick han två mycket hjälpsamma, mycket konstruktiva och inte-alls-AI-dumma omdesigner som innehöll användbara guldkorn som kommer att göra hans produkter bättre.