今週初め、OpenAIは新しい画像生成エンジン「ChatGPT Images 2.0」を発表した。今回のリリースの肝は、「装飾品」(OpenAIの表現)から、詳細なテキストを含むフルページグラフィックへと機能が飛躍したことだ。

私はプレリリース版に早期アクセスしていた。かなりうまく動いたが、ZDNETのロゴでよく間違えていた。製品が正式リリースされた今、幅広い課題で徹底的にテストしている。

Images 2.0はすべてのChatGPT層で利用可能だが、より高度な言語機能は、Thinkingモデルを使える有料層でのみ利用できる。私はChatGPT PlusアカウントでThinkingをオンにしてテストを実行している。

では、ZDNETのブランディング演習から始めよう。ZDNETのページをアップロードしてロゴを探させるのではなく、ZDNETロゴのスタンドアロン画像を作成し、各プロンプトでそれをアップロードした。それが大いに役立ったようだ。[一つ注意:ZDNETはOpenAIが自社ページをスクレイピングすることを許可していない。ZDNETの親会社であるZiff Davisは2025年4月にOpenAIを提訴し、AIシステムのトレーニングと運用においてZiff Davisの著作権を侵害したと主張している。そのため、Chrome拡張機能を使って、Images 2.0でテストしたい記事の全画面スクリーンショットをキャプチャした。それによってChatGPTがそれらを読めるようになった。]

出発点は、私が以前Images 2.0について書いた記事だった。ChatGPTに次のプロンプトを与えた:「この記事の詳細で鮮やかなインフォグラフィックを、ZDNETブランドスタイルと添付のZDNETロゴを使って作成してください。」ロゴが正しいだけでなく、色使いもZDNETに完璧だ。しかし、この画像が本当に輝くのはテキストの使い方だ。すべてのテキストが正しく、画像内の斜めの小さなテキストまで正確だ。

次に、数ヶ月前にGoogleのNano Bananaに与えたスケッチノートの課題を再訪することにした。当時の課題は、アメリカ権利章典のスケッチノート版を作成することだった。Nano Bananaは画像は素晴らしかったが、文言を正しくするのに何度も何度も(本当に何度も)試行錯誤が必要だった。ChatGPT Images 2.0では、少し難易度を上げた。スケッチノートが欲しかったが、ZDNETのブランディングスタイルで欲しかった。最初のプロンプトはこれだ:「アメリカ権利章典のスケッチノートを作ってください。ZDNETロゴスタイルを使い、スケッチノートをZDNETスタイルで作成してください。」それが左の画像だ。2番目のプロンプトはこれ:「ZDNETロゴを含め、黒背景にネオンカラーを追加してください。」それが右の画像だ。まず、テキストが正しいことに注目。重複はなく、欠落もない。すでに、これはNano Bananaのパフォーマンスをはるかに上回っている。両方のバージョンがZDNETのスタイルに合っている。唯一不満なのは、2番目の画像でZDNETロゴが押し込まれているように見えることだ。それでも、ロゴは正しく、あと数回プロンプトを調整すれば、より良い配置にできるだろう。

しかし、ここでテストで明らかになった自滅的ミスに話が及ぶ。Images 2.0に、私のAIウェブサイトビルダー対決記事をインフォグラフィックに変換するよう依頼した。ややごちゃごちゃしているが、実用的なインフォグラフィックを生成した。インターネットにアクセスして、基本価格など記事にない情報まで追加した。しかし、事実誤認もいくつか追加した。星評価が間違っていたり、製品説明の一つが不正確だったり、「AI Builders」という存在しない会社を作り出したりした。公平に言えば、これらはすべて、社内の人間のグラフィックデザイナーが初稿で作りかねないミスだ。修正を加えて再プロンプトしたところ(2枚目の画像では星評価は修正しなかったが)、Images 2.0はより適切な情報でインフォグラフィックを正しく修正した。

今回のImages 2.0リリースは、以前のバージョンから大幅な改善だ。昨年見たChatGPT Imagesバージョンも印象的だったが、特に画像の再文脈化において優れていた。実際のコンテンツを解釈して画像を作成できるこの新バージョンは、以前のビルドから大きな飛躍だ。さらに重要なのは、