ここ1週間、ZDNetのDavid Gewirtz氏はOpenAIの新しいChatGPT Images 2.0リリースを試している。彼によれば、これは一見したよりもはるかに重要なリリースだという。私たちは皆、AI画像生成ツールに感心してきた。美しい画像を作り、楽しいトリックをこなし、大量のAIゴミを生み出す。しかしこれまでは、生成するものに対する理解が限られていた。Images 2.0は画像生成に主題の知能を追加し、ChatGPTが課題を受け取って高価値の出力を生成できるようになった。例えば、アプリのユーザーインターフェースを1998年のGeoCitiesページのようにせずに再設計する、といった具合だ。

Gewirtz氏は現在取り組んでいる2つのUIデザインを、月額20ドルのChatGPT PlusプランでChatGPT Images 2.0に投入した。わずか数分で、ChatGPTは2つの再設計されたユーザーインターフェースを返し、その両方に彼が製品に取り入れようと考えている多くのデザイン改善が含まれていた。1つ目は、1月からClaude Codeを使ってバイブコーディングしているMacアプリだ。週に1〜2時間しか作業できず、macOSの内部AIを画像処理と分析に使用しているため、プロジェクトは時間がかかっている。彼はスクリーンショットをアップロードし、「このユーザーインターフェースをより魅力的で使いやすく再設計してください」とプロンプトを送った。最初は変更点を気に入らなかった。最も明白な変更はカラーボタンがなくなったことで、AIはグリッドビューの下部に表示オプションがあることを完全には理解していなかった。しかしその一方で、新しいモックアップには彼が取り入れようと考えている5つのデザインノートが含まれており、モックアップがあればClaude Codeに何をしてほしいかを示すのがずっと簡単になった。

次は、彼のセキュリティ製品のスタートページのUIだった。彼のデザインはクリーンだが非常に初歩的で、主にCSSでのコーディングが嫌いであることを反映していた。昨年秋、初めてのエージェントベースのバイブコーディングプロジェクトで、ChatGPT PlusプランのOpenAIのCodexを使ってUIをかなり醜いものから無難なものに再設計した。今回は、スクリーンショットをChatGPTに貼り付けたが、プロンプトを与える前に誤ってリターンキーを押してしまった。ChatGPTは自らページを分析し、「最大の問題は弱い視覚的階層、グレーが多すぎること、非常に長いイントロブロック、そして重要度が同じでないにもかかわらず同じように注目を競う3つの下のカードです」と推測した。また、「よりモダンな管理画面の美学」を推奨した。Gewirtz氏は「再定義されたインターフェースの画像を提供してください」と指示し、AIはロゴを発明し(主に彼がロゴを提供していなかったため)、彼が気に入ったいくつかの機能を追加したデザインを生成した。クイックセットアップゾーン、ヘルプが必要なゾーン、プライバシー設定/ドキュメント表示セクション、そして下部にサイトステータスセクションが含まれていた。

Gewirtz氏は、この機能はChatGPTが最初に登場した時や、昨夏にエージェンティックペアプログラミングが登場した時と同じくらいゲームチェンジャーだと感じている。彼は2つの製品UIをAIに提出し、実質的にピアレビューされたコメントと一連のプロトタイプデザインを受け取った。一人のプログラマーとして、この出力は非常に貴重だ。たとえプログラマーとデザイナーを抱える完全な社内チームがいたとしても、この分析を実行しレビュー用のプロトタイプを構築するにはおそらく1週間ほどかかっただろう。そのプロジェクトの人件費だけでもかなりの額になる。しかし20ドルで、彼は非常に役立ち、非常に建設的で、まったくAIバカではない再設計を2つ手に入れた。それらには彼の製品をより良くする実行可能なヒントが含まれていた。