最近、ZDNetのDavid Gewirtzは、古典的な夫婦のテクニカルサポートのシナリオに直面した。彼の妻Deniseは、教会の聖歌隊で歌っており、黄色い紙に印刷された楽譜(だいたい文庫本サイズ)をスキャンしてPDFにし、黄色い背景を除去し、8.5×11インチの用紙に拡大印刷して、老眼鏡なしで読めるようにする必要があった。また、彼女はその楽譜をPlayScore 2(楽譜を再生して歌えるアプリ)に取り込む予定で、黄色がソフトウェアを混乱させるのを心配していた。
Gewirtzは最初にPhotoshopを提案したが、プロセスが面倒すぎることがわかった。画像ごとに異なるスライダー設定が必要だったからだ。そこで彼はChatGPTを提案した。DeniseはChatGPT Plusアカウントで使用している。黄色の除去はうまくいったが、出力は低解像度だった。追加のリクエストで解像度は改善されたが、ChatGPTは結果のPDFを微妙に変更していた。Deniseは、音符や歌詞が変わってしまい、間違った曲を練習することになるのを心配した。
Gewirtzが説明するように、ChatGPTや他のAIは「非決定論的」であり、同じ入力から異なる出力を生成する可能性がある。まるでおしゃべりな配管工のようだ。Deniseは厳密に決定論的なツールを望んでいた。彼女の音楽のマスターに勝手な変更を加えないものだ。Gewirtzは、ハーバード大学のPython認定資格のためにインタラクティブな画像管理ツールを作成した経験があり、Pythonには必要なライブラリがあることを知っていたが、自分でコードを書く時間がなかった。
そこで彼は、合理的な人間なら誰でもすることをした。非決定論的なAIを使って、決定論的なPythonスクリプトを書かせたのだ。彼はChatGPTに、JPEGまたはPDFを受け取り、非グレー/非黒のピクセルを白に設定し、色付き背景上の黒いテキストのためにわずかに色づいたグレーを保持するスクリプトを要求するプロンプトを与えた。夕食ができる頃(彼はロティサリーチキンの準備も手伝っていた)、ChatGPTは動作するスクリプトを生成していた。
できあがったツール、decolor_pdf.pyは、コマンドラインから実行し、背景色を除去した新しいPDFを出力する。Gewirtzはそれを自身のGitHubリポジトリに公開し、ジャズの巨匠Fats Waller(Andy Razafと共作、「Ain't Misbehavin'」で知られる)のパブリックドメインの曲でデモを行った。
教訓は? 素早い解決策が必要なら、ChatGPTに書いてもらおう。Gewirtzにとってはうまくいった。彼は妻の問題を解決し、同時にロティサリーチキンのチキンを外すこともできたのだ。