OpenAIは木曜日、同社のAPIに、開発者がユーザーとの会話を話し、書き起こし、翻訳できるアプリを作成するための新しい音声インテリジェンス機能が多数含まれるようになると発表した。
同社の新しいGPT‑Realtime‑2は、別の音声モデルであり、ユーザーと会話できるリアルな音声シミュレーションを作成するために構築された。しかし、前身(GPT-Realtime-1.5)とは異なり、これはGPT‑5クラスの推論を備えており、OpenAIによれば、ユーザーからのより複雑なリクエストに対処するために作成されたという。
同社はまた、GPT‑Realtime‑Translateも発表している。これは、その名の通り、ユーザーに「ついていく」会話型のリアルタイム翻訳サービスを提供するために設計されている。この機能には、70以上の入力言語(つまり、理解できる言語)と13の出力言語が含まれている。