Przez ostatni tydzień David Gewirtz z ZDNet grzebał w nowym wydaniu ChatGPT Images 2.0 od OpenAI, które jego zdaniem jest o wiele bardziej znaczące, niż się wydaje na pierwszy rzut oka. Wszyscy byliśmy pod wrażeniem generatorów obrazów AI – robią ładne obrazki, wykonują zabawne sztuczki i produkują mnóstwo AI-śmieci. Ale jak dotąd były ograniczone w rozumieniu tego, co produkują. Images 2.0 dodaje inteligencję tematyczną do generowania obrazów, co oznacza, że ChatGPT może teraz otrzymywać zadania i produkować wartościowe wyniki – na przykład przeprojektować interfejs użytkownika twojej aplikacji, nie robiąc z niego strony GeoCities z 1998 roku.
Gewirtz wrzucił dwa projekty UI, nad którymi aktywnie pracuje, do ChatGPT Images 2.0 w swoim planie ChatGPT Plus za 20 dolarów miesięcznie. W ciągu kilku minut ChatGPT zwrócił dwa przeprojektowane interfejsy użytkownika, z których oba zaowocowały mnóstwem ulepszeń projektowych, które planuje wdrożyć w swoich produktach. Pierwszym była aplikacja na Maca, którą od stycznia koduje na vibe z Claude Code – projekt, który trwa długo, bo ma tylko godzinę lub dwie tygodniowo na pracę nad nim, a do przetwarzania i analizy obrazów używa wewnętrznego AI macOS. Wrzucił zrzut ekranu i poprosił AI: „Przeprojektuj ten interfejs użytkownika, aby był bardziej atrakcyjny i łatwiejszy w użyciu”. Na początku nie podobały mu się zmiany – najbardziej oczywistą było usunięcie kolorowych przycisków, a AI nie do końca zrozumiało, że na dole widoku siatki są opcje przeglądania. Z drugiej strony nowy mockup zawierał pięć uwag projektowych, które planuje wdrożyć, a posiadanie mockupu znacznie ułatwia pokazanie Claude Code, co ma robić.
Następny był interfejs strony startowej jego produktu zabezpieczającego. Jego projekt był czysty, ale dość prymitywny, głównie odzwierciedlając fakt, że nie lubi kodować w CSS. W zeszłej jesieni, w swoim pierwszym projekcie kodowania na vibe opartym na agentach, użył Codex od OpenAI w swoim planie ChatGPT Plus, aby przeprojektować UI z dość brzydkiego na nieobraźliwy. Tym razem wkleił zrzut ekranu do ChatGPT, ale przypadkiem nacisnął Enter, zanim zdążył podać prompt. ChatGPT sam zdecydował się przeanalizować stronę, stwierdzając, że „Największymi problemami są słaba hierarchia wizualna, zbyt dużo szarości, bardzo długi blok wprowadzający oraz trzy dolne karty, które konkurują o uwagę, mimo że nie są równie ważne”. Zalecił też „bardziej nowoczesną estetykę administracyjną”. Gewirtz następnie polecił mu: „Daj mi obraz przeprojektowanego interfejsu”, a AI wyprodukowało projekt, który wymyślił logo (głównie dlatego, że nie dostarczył żadnego) i dodał kilka funkcji, które mu się spodobały, w tym strefę szybkiej konfiguracji, strefę pomocy, sekcję Konfiguruj prywatność/Przeglądaj dokumenty oraz sekcję Status witryny na dole.
Gewirtz uważa, że ta możliwość jest tak samo przełomowa jak ChatGPT, gdy pojawił się po raz pierwszy, i jak agentowe programowanie w parach, gdy pojawiło się zeszłego lata. Przedłożył AI dwa interfejsy użytkownika produktów i otrzymał zasadniczo recenzję rówieśniczą wraz z zestawem prototypów. Jako samotny programista, ten wynik jest bezcenny – nawet gdyby miał pełny zespół wewnętrzny z programistami i projektantami, prawdopodobnie zajęłoby to około tygodnia, aby przeprowadzić tę analizę i skonstruować prototypy do oceny. Same koszty płac dla tego projektu byłyby dość znaczne. Ale za 20 dolarów otrzymał dwa bardzo pomocne, bardzo konstruktywne i wcale nie głupie AI przeprojektowania, które zawierały praktyczne wskazówki, które ulepszą jego produkty.