OpenAI a annoncé jeudi que son API inclura désormais un certain nombre de nouvelles fonctionnalités d'intelligence vocale conçues pour aider les développeurs à créer des applications capables de parler, transcrire et traduire des conversations avec les utilisateurs.

Le nouveau GPT-Realtime-2 de l'entreprise est un autre modèle vocal, construit pour créer une simulation vocale réaliste capable de converser avec les utilisateurs. Cependant, contrairement à son prédécesseur (GPT-Realtime-1.5), celui-ci est construit avec un raisonnement de classe GPT-5 qu'OpenAI affirme avoir été créé pour traiter des demandes plus complexes des utilisateurs.

L'entreprise lance également GPT-Realtime-Translate qui, comme son nom l'indique, est conçu pour fournir des services de traduction en temps réel qui « suivent le rythme » de l'utilisateur, de manière conversationnelle. La fonctionnalité comprend plus de 70 langues d'entrée (c'est-à-dire les langues qu'elle peut comprendre) et 13 langues de sortie.