OpenAI 在 API 中推出全新语音智能功能

OpenAI 周四宣布其 API 新增多项语音智能功能，包括基于 GPT-5 推理能力的语音模型和实时翻译服务，支持超过 70 种输入语言。

OpenAI 周四宣布，其 API 现在将包含一系列全新的语音智能功能，旨在帮助开发者创建能够与用户对话、转录和翻译对话的应用。

该公司的新模型 GPT-Realtime-2 是另一个语音模型，旨在创建逼真的语音模拟，能够与用户对话。然而，与其前身（GPT-Realtime-1.5）不同，这个模型采用了 GPT-5 级别的推理能力，OpenAI 称其旨在处理用户更复杂的请求。

该公司还推出了 GPT-Realtime-Translate，顾名思义，它旨在提供实时翻译服务，能够“跟上”用户的对话节奏。该功能支持超过 70 种输入语言（即它能理解的语言）和 13 种输出语言。

OpenAI 语音智能 API

阅读本文（其他语言）： English العربية Deutsch Español Français हिन्दी Italiano 日本語 한국어 Nederlands Polski Português Română Русский Svenska Türkçe