Google anunciou hoje que seu modelo Gemini 3.5 Live Translate está agora disponível ao público, marcando um passo significativo em direção a conversas multilíngues em tempo real e sem interrupções. O sistema de voz-para-voz detecta automaticamente a língua falada, traduz para mais de 70 idiomas-alvo e reproduz a entonação, o ritmo e o tom do falante. Na prática, o modelo acompanha o ritmo de um diálogo normal, atrasando apenas alguns segundos em relação à fala original.

O lançamento segue uma série de demonstrações em estágios que o Google tem apresentado em seu evento anual de I/O e outros lançamentos de produtos. Embora os protótipos anteriores exigissem hardware específico - como telefones Pixel ou Pixel Buds - o Google afirma que a nova oferta funciona em uma gama mais ampla de dispositivos e se integra diretamente ao aplicativo Tradutor, Google Meet e outros serviços. A empresa apresenta o lançamento como a culminação de anos de "experimentos de aprendizado de máquina pioneiros" visando quebrar barreiras linguísticas.

O Gemini 3.5 Live Translate pertence à família de versão 3.5 que estreou no início deste ano. Até agora, apenas a variante "Flash" do modelo alcançou os usuários, com o Google sugerindo que uma versão mais poderosa "Pro" pode chegar nas próximas semanas. O modelo atual processa a fala continuamente, lidando com entradas multilíngues sem exigir que os desenvolvedores configurem as configurações de idioma manualmente. Ele também inclui supressão de ruído embutida, permitindo tradução clara mesmo em ambientes movimentados.

Os desenvolvedores podem começar a construir aplicativos com o modelo por meio de uma pré-visualização pública da API Gemini Live e do AI Studio. A API oferece um fluxo de trabalho simplificado: os desenvolvedores enviam um fluxo de áudio contínuo, e o serviço retorna a fala traduzida em tempo real. O Google enfatiza que a baixa latência do sistema e a saída de voz natural reduzem a sensação robótica que tem afligido os ferramentas de tradução anteriores.

Observadores da indústria notam que o lançamento pode acelerar a adoção de tradução em tempo real nos negócios, educação e viagens. Ao incorporar a tecnologia em todo o seu ecossistema, o Google se posiciona para se tornar a plataforma padrão para comunicação multilíngue instantânea. A empresa não divulgou detalhes de preços para o nível Pro que está por vir, mas a pré-visualização sugere um nível gratuito para desenvolvedores que experimentam a tecnologia.

Cet article a été rédigé avec l'assistance de l'IA.
News Factory APP - actualités agentiques pour booster votre SEO et AEO.