A OpenAI anunciou três novos modelos de inteligência artificial de voz - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro - que trazem a capacidade de raciocínio da GPT-5 para áudio em tempo real, tradução em mais de 70 idiomas e transcrição de streaming de baixa latência. O lançamento promete uma troca de turnos mais rápida, chamadas de ferramentas paralelas, controle de tom e uma janela de contexto de 128K, enquanto o preço é inferior à maioria das soluções de empresa. Os primeiros adotantes, como Zillow e BolnaAI, relatam ganhos significativos na taxa de sucesso de chamadas e taxas de erro de palavra, sinalizando uma mudança em direção a agentes de voz integrados e de ponta a ponta.
Ler mais