Google lançou uma nova capacidade para seu Gemini AI que vai além de imagens estáticas e texto. O chatbot agora produz modelos e simulações tridimensionais interativos que os usuários podem manipular em tempo real. Quando um usuário da versão Pro pede ao Gemini para ilustrar algo - digamos, um pêndulo duplo ou a órbita da Lua em torno da Terra - o sistema gera um modelo rotativo, completo com sliders e toggles que permitem ao usuário alterar a velocidade, ocultar elementos ou pausar a animação.

Em um teste prático, o autor solicitou ao Gemini uma simulação Lua-Terra. O AI respondeu com uma cena 3D onde a Lua podia ser girada em torno do planeta, sua órbita podia ser ocultada e um slider de velocidade permitia ao usuário acelerar ou desacelerar o movimento. Os controles de zoom e rotação funcionaram suavemente, tornando a experiência mais parecida com um laboratório de física leve do que com uma troca típica de chatbot.

Essa atualização chega apenas semanas após os rivais Anthropic e OpenAI introduzirem ferramentas visuais comparáveis. O Claude da Anthropic agora anexa gráficos, diagramas e outras gráficos interativos às suas respostas, enquanto o ChatGPT da OpenAI pode gerar visualizações para tópicos de matemática e ciência. Até agora, o Gemini só podia produzir imagens interativas estáticas; a nova funcionalidade 3D marca sua primeira incursão em simulações dinâmicas.

O acesso à funcionalidade é limitado ao modelo Pro do Gemini. Os usuários selecionam a opção Pro na barra de prompts, formulam um pedido como "mostre-me um pêndulo duplo" e, em seguida, clicam no botão "Mostre-me a visualização" que aparece abaixo da resposta de texto do Gemini. O AI, então, renderiza o modelo e apresenta os controles interativos.

O lançamento da Google sugere que a empresa vê as visualizações interativas como uma maneira de aprofundar o engajamento do usuário e diferenciar o Gemini em um mercado de chatbots de IA lotado. Ao permitir que os usuários explorem conceitos de forma prática, o Gemini se aproxima do tipo de ferramentas de aprendizado experencial tradicionalmente reservadas para software especializado.

Observadores da indústria notam que a corrida para incorporar saída visual em IA conversacional pode redefinir como educadores, engenheiros e usuários casuais buscam respostas. À medida que mais plataformas adotam gráficos em tempo real, a linha entre busca, tutoria e simulação se torna borrosa, abrindo novas possibilidades para produtividade e entretenimento.

Questo articolo è stato scritto con l'assistenza dell'IA.
News Factory APP - notizie agentiche per potenziare il tuo SEO e AEO.

Google adiciona modelos 3D interativos ao Gemini AI, permitindo que os usuários ajustem simulações em tempo real

Key Points

Disponibile anche in: