OpenAI uruchamia nowe funkcje inteligencji głosowej w swoim API

OpenAI ogłosiło nowe funkcje głosowe w API, w tym modele GPT‑Realtime‑2 i GPT‑Realtime‑Translate, które mają pomóc programistom w tworzeniu aplikacji do rozmów, transkrypcji i tłumaczeń.

OpenAI ogłosiło w czwartek, że jego API będzie teraz zawierać szereg nowych funkcji inteligencji głosowej, zaprojektowanych, aby pomóc programistom tworzyć aplikacje, które mogą rozmawiać, transkrybować i tłumaczyć konwersacje z użytkownikami.

Nowy GPT‑Realtime‑2 to kolejny model głosowy, zbudowany do tworzenia realistycznej symulacji wokalnej, która może prowadzić rozmowy z użytkownikami. Jednak w przeciwieństwie do swojego poprzednika (GPT-Realtime-1.5), ten jest zbudowany z rozumowaniem klasy GPT‑5, które – jak twierdzi OpenAI – zostało stworzone do obsługi bardziej skomplikowanych żądań od użytkowników.

Firma uruchamia również GPT‑Realtime‑Translate, który – jak sama nazwa wskazuje – ma zapewniać usługi tłumaczenia w czasie rzeczywistym, które „dotrzymują kroku” użytkownikowi w konwersacji. Funkcja obsługuje ponad 70 języków wejściowych (czyli języków, które może zrozumieć) i 13 języków wyjściowych.

OpenAI API inteligencja głosowa

Czytaj oryginalne źródło ↗

Więcej wiadomości AI & Machine Learning →

Czytaj ten artykuł w: English العربية Deutsch Español Français हिन्दी Italiano 日本語 한국어 Nederlands Português Română Русский Svenska Türkçe 中文

OpenAI uruchamia nowe funkcje inteligencji głosowej w swoim API

Wiadomości w Twojej skrzynce.