OpenAIはChatGPT向けの素晴らしい新機能を発表した。プロンプトインジェクション攻撃——悪意のあるチャットボットの指示がWebページなどに隠され、AIを騙して秘密を漏らさせる愉快なシナリオ——から追加の保護を提供するという。
ロックダウンモードと呼ばれるこの機能は、安全性を保つためにいくつかの主要機能を無効にする:ライブWebブラウジング(キャッシュされたコンテンツで我慢しろ)、Webからの画像の取得と表示(生成はOK、なぜならそれは問題ないから)、ディープリサーチ、エージェントモード。製品を便利にする機能をオフにすること以上に「安全」を語るものはない。
同社は、ロックダウンモードをオンにしてもChatGPTがプロンプトインジェクションに対して脆弱であり得ることを、さわやかな正直さで認めている。これらは「キャッシュされたWebコンテンツやアップロードされたファイルに現れ、応答の動作や正確性に影響を与える可能性がある」と同社は指摘する。言い換えれば、これは絆創膏であって治療法ではない。
しかし目標は、その過程で機密データが共有される可能性を減らすことだとOpenAIは言う。これは、シートベルトが衝突時の負傷の可能性を減らすと言うようなものだ——真実だが、テストしたくはない。
「ロックダウンモードはすべての人のためのものではありません」とOpenAIは明確にする。「機密データを扱い、プロンプトインジェクションに関連するデータ流出リスクからより厳格な保護を求める個人や組織向けに設計されています。」つまり、基本的には、機密メモがハッカーのチャット履歴に現れるのを望まない人のためのものだ。
同社は現在、ロックダウンモードをセルフサービスのChatGPT Businessアカウントと、対象となる個人アカウントに展開していると述べている。インターネットが相変わらずインターネットであり続ける中で、まだ展開中の機能ほど「安全なAI」を語るものはない。