OpenAI ogłosiło w czwartek, że jego API będzie teraz zawierać szereg nowych funkcji inteligencji głosowej, zaprojektowanych, aby pomóc programistom tworzyć aplikacje, które mogą rozmawiać, transkrybować i tłumaczyć konwersacje z użytkownikami.
Nowy GPT‑Realtime‑2 to kolejny model głosowy, zbudowany do tworzenia realistycznej symulacji wokalnej, która może prowadzić rozmowy z użytkownikami. Jednak w przeciwieństwie do swojego poprzednika (GPT-Realtime-1.5), ten jest zbudowany z rozumowaniem klasy GPT‑5, które – jak twierdzi OpenAI – zostało stworzone do obsługi bardziej skomplikowanych żądań od użytkowników.
Firma uruchamia również GPT‑Realtime‑Translate, który – jak sama nazwa wskazuje – ma zapewniać usługi tłumaczenia w czasie rzeczywistym, które „dotrzymują kroku” użytkownikowi w konwersacji. Funkcja obsługuje ponad 70 języków wejściowych (czyli języków, które może zrozumieć) i 13 języków wyjściowych.