Tags: ferramentas de desenvolvedor

OpenAI adiciona voz em tempo real, tradução e transcrição à sua API

OpenAI adiciona voz em tempo real, tradução e transcrição à sua API
OpenAI anunciou na quinta-feira que sua API agora suporta três novos modelos de voz - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro. A suíte permite que os desenvolvedores construam aplicações que possam conversar, traduzir e transcrever discurso em tempo real, com suporte a mais de 70 idiomas de entrada e 13 idiomas de saída. A cobrança é dividida entre taxas por minuto para tradução e transcrição e preços baseados em tokens para o modelo conversacional. OpenAI afirma que as ferramentas visam plataformas de atendimento ao cliente, educação, mídia e criadores, e incluem barreiras para evitar o uso indevido. Ler mais

OpenAI Apresenta Três Modelos de Voz em Tempo Real, Expandindo a IA para Conversas ao Vivo, Tradução e Transcrição de Streaming

OpenAI Apresenta Três Modelos de Voz em Tempo Real, Expandindo a IA para Conversas ao Vivo, Tradução e Transcrição de Streaming
OpenAI anunciou três novos modelos de áudio para sua API em Tempo Real - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro. A suíte impulsiona a IA de voz além de simples trocas de diálogo, oferecendo raciocínio ao vivo, tradução em tempo real em mais de 70 idiomas e transcrição de streaming. Desenvolvedores agora podem criar assistentes que agendam visitas a casas, gerenciam reservas de viagem ou fornecem legendas em tempo real, enquanto o preço começa em $0,017 por minuto para Sussurro e $0,034 por minuto para Traduzir, com GPT-Realtime-2 cobrado em $32 por milhão de tokens de áudio. Ler mais

Anthropic Lança Recurso de "Sonhar" para Agentes Gerenciados Claude

Anthropic Lança Recurso de "Sonhar" para Agentes Gerenciados Claude
São Francisco – Na conferência de desenvolvedores Code with Claude, a Anthropic anunciou um novo recurso de "sonhar" para seus Agentes Gerenciados Claude. O recurso, agora em prévia de pesquisa, examina as interações recentes, extrai detalhes relevantes e os armazena na memória para melhorar as tarefas futuras. A Anthropic afirma que o sonhar ajuda a mitigar as janelas de contexto limitadas dos grandes modelos de linguagem, preservando informações críticas em projetos de longo prazo. O lançamento está atualmente restrito a Agentes Gerenciados na Plataforma Claude, uma alternativa de nível superior à API de Mensagens que permite que vários agentes colaborem por períodos prolongados. Ler mais