OpenAI dijo el jueves que su API ahora incluirá una serie de nuevas funciones de inteligencia de voz diseñadas para ayudar a los desarrolladores a crear aplicaciones que puedan hablar, transcribir y traducir conversaciones con los usuarios.
La nueva GPT‑Realtime‑2 de la compañía es otro modelo de voz, construido para crear una simulación vocal realista que pueda conversar con los usuarios. Sin embargo, a diferencia de su predecesor (GPT-Realtime-1.5), este está construido con razonamiento de clase GPT‑5 que OpenAI dice que fue creado para manejar solicitudes más complicadas de los usuarios.
La compañía también está lanzando GPT‑Realtime‑Translate que, como su nombre lo indica, está diseñado para proporcionar servicios de traducción en tiempo real que "sigan el ritmo" del usuario, de manera conversacional. La función incluye más de 70 idiomas de entrada (es decir, los idiomas que puede comprender) y 13