오픈AI는 목요일, 자사의 API에 개발자들이 사용자와 대화하고, 받아쓰고, 번역할 수 있는 앱을 만들 수 있도록 돕는 여러 새로운 음성 지능 기능이 포함될 것이라고 발표했다.
회사의 새로운 GPT-Realtime-2는 또 다른 음성 모델로, 사용자와 대화할 수 있는 현실적인 음성 시뮬레이션을 만들기 위해 구축되었다. 그러나 전작(GPT-Realtime-1.5)과 달리, 이 모델은 오픈AI가 사용자의 더 복잡한 요청을 처리하기 위해 만들었다고 말하는 GPT-5급 추론 능력을 갖추고 있다.
회사는 또한 GPT-Realtime-Translate를 출시하고 있는데, 이름 그대로 사용자와 대화 속도를 맞추며 실시간 번역 서비스를 제공하도록 설계되었다. 이 기능은 70개 이상의 입력 언어(즉, 이해할 수 있는 언어)와 13개의 출력 언어를 지원한다.