OpenAI lança novos recursos de inteligência de voz em sua API

A OpenAI anunciou novos recursos de inteligência de voz em sua API, incluindo modelos de conversação e tradução em tempo real, com um tom irônico sobre a evolução dos assistentes de voz.

A OpenAI anunciou na quinta-feira que sua API agora incluirá uma série de novos recursos de inteligência de voz, projetados para ajudar desenvolvedores a criar aplicativos que possam conversar, transcrever e traduzir conversas com usuários.

O novo GPT-Realtime-2 da empresa é outro modelo de voz, construído para criar uma simulação vocal realista que pode conversar com usuários. No entanto, ao contrário de seu antecessor (GPT-Realtime-1.5), este é construído com raciocínio de classe GPT-5 que a OpenAI diz ter sido criado para lidar com solicitações mais complicadas dos usuários.

A empresa também está lançando o GPT-Realtime-Translate que, como o nome sugere, é projetado para fornecer serviços de tradução em tempo real que "acompanham" o usuário, de forma conversacional. O recurso inclui mais de 70 idiomas de entrada (ou seja, os idiomas que pode compreender) e 13

Ler fonte original ↗

Mais notícias de AI & Machine Learning →

Ler este artigo em: English العربية Deutsch Español Français हिन्दी Italiano 日本語 한국어 Nederlands Polski Română Русский Svenska Türkçe 中文

OpenAI lança novos recursos de inteligência de voz em sua API

Notícias na sua caixa.