OpenAIのChatGPT Images 2.0：ついに実務で使えるレベルに。猫をルネサンス教皇に仕立てるだけじゃなく

OpenAIのChatGPT Images 2.0は、正しいテキストとロゴでインフォグラフィックを生成できるようになったが、架空の会社や間違った星評価を時々作り出すため、基本的に中間管理職向けの出来だ。

今週初め、OpenAIは新しい画像生成エンジン「ChatGPT Images 2.0」を発表した。今回のリリースの肝は、「装飾品」（OpenAIの表現）から、詳細なテキストを含むフルページグラフィックへと機能が飛躍したことだ。

私はプレリリース版に早期アクセスしていた。かなりうまく動いたが、ZDNETのロゴでよく間違えていた。製品が正式リリースされた今、幅広い課題で徹底的にテストしている。

Images 2.0はすべてのChatGPT層で利用可能だが、より高度な言語機能は、Thinkingモデルを使える有料層でのみ利用できる。私はChatGPT PlusアカウントでThinkingをオンにしてテストを実行している。

では、ZDNETのブランディング演習から始めよう。ZDNETのページをアップロードしてロゴを探させるのではなく、ZDNETロゴのスタンドアロン画像を作成し、各プロンプトでそれをアップロードした。それが大いに役立ったようだ。[一つ注意：ZDNETはOpenAIが自社ページをスクレイピングすることを許可していない。ZDNETの親会社であるZiff Davisは2025年4月にOpenAIを提訴し、AIシステムのトレーニングと運用においてZiff Davisの著作権を侵害したと主張している。そのため、Chrome拡張機能を使って、Images 2.0でテストしたい記事の全画面スクリーンショットをキャプチャした。それによってChatGPTがそれらを読めるようになった。]

出発点は、私が以前Images 2.0について書いた記事だった。ChatGPTに次のプロンプトを与えた：「この記事の詳細で鮮やかなインフォグラフィックを、ZDNETブランドスタイルと添付のZDNETロゴを使って作成してください。」ロゴが正しいだけでなく、色使いもZDNETに完璧だ。しかし、この画像が本当に輝くのはテキストの使い方だ。すべてのテキストが正しく、画像内の斜めの小さなテキストまで正確だ。

次に、数ヶ月前にGoogleのNano Bananaに与えたスケッチノートの課題を再訪することにした。当時の課題は、アメリカ権利章典のスケッチノート版を作成することだった。Nano Bananaは画像は素晴らしかったが、文言を正しくするのに何度も何度も（本当に何度も）試行錯誤が必要だった。ChatGPT Images 2.0では、少し難易度を上げた。スケッチノートが欲しかったが、ZDNETのブランディングスタイルで欲しかった。最初のプロンプトはこれだ：「アメリカ権利章典のスケッチノートを作ってください。ZDNETロゴスタイルを使い、スケッチノートをZDNETスタイルで作成してください。」それが左の画像だ。2番目のプロンプトはこれ：「ZDNETロゴを含め、黒背景にネオンカラーを追加してください。」それが右の画像だ。まず、テキストが正しいことに注目。重複はなく、欠落もない。すでに、これはNano Bananaのパフォーマンスをはるかに上回っている。両方のバージョンがZDNETのスタイルに合っている。唯一不満なのは、2番目の画像でZDNETロゴが押し込まれているように見えることだ。それでも、ロゴは正しく、あと数回プロンプトを調整すれば、より良い配置にできるだろう。

しかし、ここでテストで明らかになった自滅的ミスに話が及ぶ。Images 2.0に、私のAIウェブサイトビルダー対決記事をインフォグラフィックに変換するよう依頼した。ややごちゃごちゃしているが、実用的なインフォグラフィックを生成した。インターネットにアクセスして、基本価格など記事にない情報まで追加した。しかし、事実誤認もいくつか追加した。星評価が間違っていたり、製品説明の一つが不正確だったり、「AI Builders」という存在しない会社を作り出したりした。公平に言えば、これらはすべて、社内の人間のグラフィックデザイナーが初稿で作りかねないミスだ。修正を加えて再プロンプトしたところ（2枚目の画像では星評価は修正しなかったが）、Images 2.0はより適切な情報でインフォグラフィックを正しく修正した。

今回のImages 2.0リリースは、以前のバージョンから大幅な改善だ。昨年見たChatGPT Imagesバージョンも印象的だったが、特に画像の再文脈化において優れていた。実際のコンテンツを解釈して画像を作成できるこの新バージョンは、以前のビルドから大きな飛躍だ。さらに重要なのは、

OpenAIのChatGPT Images 2.0：ついに実務で使えるレベルに。猫をルネサンス教皇に仕立てるだけじゃなく

ニュースをメールで。