OpenAI заявила в четверг, что её API теперь будет включать ряд новых функций голосового интеллекта, предназначенных для помощи разработчикам в создании приложений, которые могут говорить, транскрибировать и переводить разговоры с пользователями.

Новая модель компании GPT‑Realtime‑2 — ещё одна голосовая модель, созданная для реалистичной голосовой симуляции, способной общаться с пользователями. Однако, в отличие от своего предшественника (GPT-Realtime-1.5), эта построена на рассуждениях класса GPT‑5, которые, по словам OpenAI, были созданы для обработки более сложных запросов пользователей.

Компания также запускает GPT‑Realtime‑Translate, который, как следует из названия, предназначен для предоставления услуг перевода в реальном времени, «не отстающих» от пользователя в разговоре. Функция включает более 70 входных языков (то есть языков, которые она может понимать) и 13