OpenAI lancia nuove funzionalità di intelligenza vocale nella sua API

OpenAI ha annunciato nuove funzionalità di intelligenza vocale nella sua API, tra cui un modello vocale realistico e un servizio di traduzione in tempo reale.

OpenAI ha annunciato giovedì che la sua API includerà ora una serie di nuove funzionalità di intelligenza vocale progettate per aiutare gli sviluppatori a creare app in grado di parlare, trascrivere e tradurre conversazioni con gli utenti.

Il nuovo GPT‑Realtime‑2 dell'azienda è un altro modello vocale, costruito per creare una simulazione vocale realistica in grado di conversare con gli utenti. Tuttavia, a differenza del suo predecessore (GPT-Realtime-1.5), questo è costruito con un ragionamento di classe GPT‑5 che OpenAI afferma sia stato creato per gestire richieste più complesse da parte degli utenti.

L'azienda sta anche lanciando GPT‑Realtime‑Translate che, come suggerisce il nome, è progettato per fornire servizi di traduzione in tempo reale che "stanno al passo" con l'utente, in modo colloquiale. La funzionalità include più di 70 lingue di input (cioè le lingue che può comprendere) e 13

Leggi la fonte originale ↗

Altre notizie AI & Machine Learning →

Leggi questo articolo in: English العربية Deutsch Español Français हिन्दी 日本語 한국어 Nederlands Polski Português Română Русский Svenska Türkçe 中文

OpenAI lancia nuove funzionalità di intelligenza vocale nella sua API

Notizie nella tua casella.