OpenAI ha annunciato giovedì che la sua API includerà ora una serie di nuove funzionalità di intelligenza vocale progettate per aiutare gli sviluppatori a creare app in grado di parlare, trascrivere e tradurre conversazioni con gli utenti.
Il nuovo GPT‑Realtime‑2 dell'azienda è un altro modello vocale, costruito per creare una simulazione vocale realistica in grado di conversare con gli utenti. Tuttavia, a differenza del suo predecessore (GPT-Realtime-1.5), questo è costruito con un ragionamento di classe GPT‑5 che OpenAI afferma sia stato creato per gestire richieste più complesse da parte degli utenti.
L'azienda sta anche lanciando GPT‑Realtime‑Translate che, come suggerisce il nome, è progettato per fornire servizi di traduzione in tempo reale che "stanno al passo" con l'utente, in modo colloquiale. La funzionalità include più di 70 lingue di input (cioè le lingue che può comprendere) e 13