Etiquetas: herramientas para desarrolladores

OpenAI agrega voz en tiempo real, traducción y transcripción a su API

OpenAI agrega voz en tiempo real, traducción y transcripción a su API
OpenAI anunció el jueves que su API ahora admite tres nuevos modelos enfocados en la voz: GPT-Realtime-2, GPT-Realtime-Traducir y GPT-Realtime-Susurro. La suite permite a los desarrolladores crear aplicaciones que pueden conversar, traducir y transcribir el habla en tiempo real, con soporte para más de 70 idiomas de entrada y 13 idiomas de salida. La facturación se divide entre tarifas por minuto para la traducción y la transcripción y precios basados en tokens para el modelo conversacional. OpenAI afirma que las herramientas están dirigidas a plataformas de servicio al cliente, educación, medios y creadores, e incluye salvaguardias para prevenir el mal uso. Leer más

OpenAI Presenta Tres Modelos de Voz en Tiempo Real, Ampliando la IA a Conversaciones en Vivo, Traducción y Transcripción de Streaming

OpenAI Presenta Tres Modelos de Voz en Tiempo Real, Ampliando la IA a Conversaciones en Vivo, Traducción y Transcripción de Streaming
OpenAI anunció tres nuevos modelos de audio para su API en Tiempo Real: GPT-Realtime-2, GPT-Realtime-Traducir y GPT-Realtime-Susurro. La suite impulsa la IA de voz más allá de simples intercambios, ofreciendo razonamiento en vivo, traducción en tiempo real en más de 70 idiomas y transcripción de streaming. Los desarrolladores ahora pueden crear asistentes que programen visitas a hogares, gestionen reservas de viaje o proporcionen subtítulos en tiempo real, mientras que los precios comienzan en $0,017 por minuto para Susurro y $0,034 por minuto para Traducir, con GPT-Realtime-2 facturado a $32 por millón de tokens de audio. Leer más

Anthropic Presenta la Función de ‘Sueño’ para Agentes Administrados de Claude

Anthropic Presenta la Función de ‘Sueño’ para Agentes Administrados de Claude
San Francisco – En la conferencia de desarrolladores Code with Claude, Anthropic anunció una nueva capacidad de ‘sueño’ para sus Agentes Administrados de Claude. La función, ahora en vista previa de investigación, examina las interacciones recientes, extrae detalles destacados y los almacena en la memoria para mejorar las tareas futuras. Anthropic afirma que el sueño ayuda a mitigar las ventanas de contexto limitadas de los grandes modelos de lenguaje al preservar la información crítica en proyectos de larga duración. La implementación actualmente está restringida a Agentes Administrados en la Plataforma Claude, una alternativa de nivel superior a la API de Mensajes que permite que varios agentes colaboren durante períodos extendidos. Leer más