Etiquetas: voice agents

OpenAI presenta GPT‑Realtime‑2 y nuevos modelos de API de voz, reduciendo costos para traducción y transcripción en tiempo real

OpenAI presenta GPT‑Realtime‑2 y nuevos modelos de API de voz, reduciendo costos para traducción y transcripción en tiempo real
OpenAI anunció tres nuevos modelos de voz: GPT‑Realtime‑2, GPT‑Realtime‑Traducir y GPT‑Realtime‑Susurro, que brindan razonamiento de clase GPT‑5 en audio en vivo, traducción en tiempo real en más de 70 idiomas y transcripción de streaming de baja latencia. La implementación promete una toma de turnos más rápida, llamadas de herramientas paralelas, control de tono y una ventana de contexto de 128K, mientras que los precios son más bajos que la mayoría de las soluciones empresariales. Leer más