Tags: voice agents

May 10, 2026

OpenAI lança GPT-Realtime-2 e novos modelos de API de voz, reduzindo custos para tradução e transcrição em tempo real

A OpenAI anunciou três novos modelos de inteligência artificial de voz - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro - que trazem a capacidade de raciocínio da GPT-5 para áudio em tempo real, tradução em mais de 70 idiomas e transcrição de streaming de baixa latência. O lançamento promete uma troca de turnos mais rápida, chamadas de ferramentas paralelas, controle de tom e uma janela de contexto de 128K, enquanto o preço é inferior à maioria das soluções de empresa. Os primeiros adotantes, como Zillow e BolnaAI, relatam ganhos significativos na taxa de sucesso de chamadas e taxas de erro de palavra, sinalizando uma mudança em direção a agentes de voz integrados e de ponta a ponta. Ler mais