A OpenAI anunciou na quinta-feira que sua API agora incluirá uma série de novos recursos de inteligência de voz, projetados para ajudar desenvolvedores a criar aplicativos que possam conversar, transcrever e traduzir conversas com usuários.

O novo GPT-Realtime-2 da empresa é outro modelo de voz, construído para criar uma simulação vocal realista que pode conversar com usuários. No entanto, ao contrário de seu antecessor (GPT-Realtime-1.5), este é construído com raciocínio de classe GPT-5 que a OpenAI diz ter sido criado para lidar com solicitações mais complicadas dos usuários.

A empresa também está lançando o GPT-Realtime-Translate que, como o nome sugere, é projetado para fornecer serviços de tradução em tempo real que "acompanham" o usuário, de forma conversacional. O recurso inclui mais de 70 idiomas de entrada (ou seja, os idiomas que pode compreender) e 13