오픈AI, API에 새로운 음성 지능 기능 출시

오픈AI가 API에 새로운 음성 지능 기능을 추가하여 개발자들이 대화, 받아쓰기, 번역이 가능한 앱을 만들 수 있게 했다.

오픈AI는 목요일, 자사의 API에 개발자들이 사용자와 대화하고, 받아쓰고, 번역할 수 있는 앱을 만들 수 있도록 돕는 여러 새로운 음성 지능 기능이 포함될 것이라고 발표했다.

회사의 새로운 GPT-Realtime-2는 또 다른 음성 모델로, 사용자와 대화할 수 있는 현실적인 음성 시뮬레이션을 만들기 위해 구축되었다. 그러나 전작(GPT-Realtime-1.5)과 달리, 이 모델은 오픈AI가 사용자의 더 복잡한 요청을 처리하기 위해 만들었다고 말하는 GPT-5급 추론 능력을 갖추고 있다.

회사는 또한 GPT-Realtime-Translate를 출시하고 있는데, 이름 그대로 사용자와 대화 속도를 맞추며 실시간 번역 서비스를 제공하도록 설계되었다. 이 기능은 70개 이상의 입력 언어(즉, 이해할 수 있는 언어)와 13개의 출력 언어를 지원한다.

오픈AI 음성인식 API

원본 기사 읽기 ↗

AI & Machine Learning 뉴스 더 보기 →

이 기사를 다른 언어로 읽기: English العربية Deutsch Español Français हिन्दी Italiano 日本語 Nederlands Polski Português Română Русский Svenska Türkçe 中文

오픈AI, API에 새로운 음성 지능 기능 출시

받은 편지함에 뉴스를.