OpenAI 周四宣布,其 API 现在将包含一系列全新的语音智能功能,旨在帮助开发者创建能够与用户对话、转录和翻译对话的应用。

该公司的新模型 GPT-Realtime-2 是另一个语音模型,旨在创建逼真的语音模拟,能够与用户对话。然而,与其前身(GPT-Realtime-1.5)不同,这个模型采用了 GPT-5 级别的推理能力,OpenAI 称其旨在处理用户更复杂的请求。

该公司还推出了 GPT-Realtime-Translate,顾名思义,它旨在提供实时翻译服务,能够“跟上”用户的对话节奏。该功能支持超过 70 种输入语言(即它能理解的语言)和 13 种输出语言。