На прошлой неделе Дэвид Гевирц из ZDNet копался в новом релизе OpenAI ChatGPT Images 2.0, который, по его словам, гораздо более значим, чем кажется на первый взгляд. Мы все впечатлены генераторами изображений на основе ИИ — они создают красивые картинки, делают забавные трюки и выдают много ИИ-мусора. Но до сих пор они были ограничены в понимании того, что производят. Images 2.0 добавляет интеллект предметной области в генерацию изображений, что означает, что ChatGPT теперь может получать задания и выдавать высокоценные результаты — например, перерабатывать пользовательский интерфейс вашего приложения, не превращая его в страницу с GeoCities 1998 года.
Гевирц скормил два дизайна интерфейсов, над которыми он активно работает, в ChatGPT Images 2.0 на своем тарифе ChatGPT Plus за 20 долларов в месяц. За несколько минут ChatGPT вернул два переработанных пользовательских интерфейса, оба из которых содержали множество улучшений дизайна, которые он планирует внедрить в свои продукты. Первым было приложение для Mac, которое он с января «вайб-кодил» с Claude Code — проект, который затягивается, потому что у него есть всего час-два в неделю на работу, и он использует внутренний ИИ macOS для обработки и анализа изображений. Он загрузил скриншот и попросил ИИ: «Переработайте этот пользовательский интерфейс, чтобы сделать его более привлекательным и удобным в использовании». Сначала ему не понравились изменения — самым очевидным была потеря цветных кнопок, и ИИ не совсем понял, что внизу сетки есть опции просмотра. Но с другой стороны, новый макет включал пять заметок по дизайну, которые он планирует внедрить, плюс наличие макета значительно упрощает демонстрацию Claude Code того, что он хочет сделать.
Далее был интерфейс стартовой страницы его продукта безопасности. Его дизайн был чистым, но довольно примитивным, в основном отражая тот факт, что он не любит кодить на CSS. Прошлой осенью, в своем первом проекте «вайб-кодинга» на основе агентов, он использовал OpenAI Codex в своем плане ChatGPT Plus, чтобы переработать интерфейс из довольно уродливого в не вызывающий возражений. На этот раз он вставил скриншот в ChatGPT, но случайно нажал Enter, прежде чем успел дать запрос. ChatGPT сам решил проанализировать страницу, сделав вывод, что «самые большие проблемы — слабая визуальная иерархия, слишком много серого, очень длинный вступительный блок и три нижние карточки, которые одинаково конкурируют за внимание, хотя они не одинаково важны». Он также рекомендовал «более современный административный эстетический стиль». Затем Гевирц поручил ему: «Предоставьте мне изображение переработанного интерфейса», и ИИ создал дизайн, который придумал логотип (в основном потому, что он его не предоставил) и добавил несколько функций, которые ему понравились, включая зону быстрой настройки, зону помощи, раздел «Настроить конфиденциальность/Просмотреть документацию» и раздел «Статус сайта» внизу.
Гевирц считает, что эта возможность так же меняет правила игры, как ChatGPT, когда он только появился, и как агентное парное программирование, когда оно появилось прошлым летом. Он отправил два пользовательских интерфейса продуктов ИИ и получил по сути рецензируемые комментарии вместе с набором прототипов дизайна. Как программист-одиночка, этот результат бесценен — даже если бы у него была полная внутренняя команда с программистами и дизайнерами в штате, вероятно, потребовалась бы неделя, чтобы провести этот анализ и создать прототипы для рассмотрения. Только расходы на зарплату для этого проекта были бы довольно значительными. Но за 20 долларов он получил два очень полезных, очень конструктивных и совсем не глупых с точки зрения ИИ редизайна, которые содержали действенные крупицы, которые сделают его продукты лучше.