Google anunciou o modelo Gemma 4 12B na segunda-feira, posicionando-o como uma alternativa leve ao modelo maior de 26 bilhões de parâmetros da família Gemma. Apesar de seu tamanho menor, o novo modelo lida com raciocínio complexo multietapas e fluxos de trabalho agênticos que anteriormente exigiam as variantes mais pesadas. A empresa afirma que o modelo 12B alcança desempenho comparável enquanto se encaixa confortavelmente em qualquer laptop equipado com 16 GB de RAM.

O Gemma 4 12B vem com redatores de Previsão de Múltiplos Tokens (MTP) integrados, uma funcionalidade que a Google anteriormente oferecia apenas como um complemento opcional para outros modelos Gemma 4. A MTP aproveita ciclos de processamento ociosos para prever vários tokens futuros de uma vez, aumentando a velocidade e reduzindo o desperdício computacional. O resultado é uma experiência do usuário mais suave e responsiva sem sacrificar a qualidade de saída.

Processamento multimodal simplificado

A série Gemma 4 é nativamente multimodal, aceitando texto, imagens e áudio. A maioria dos sistemas de IA gerativos confia em codificadores separados para entradas não-texto, um design que infla a latência e as pegadas de memória. Os engenheiros da Google reorganizaram o pipeline de visão, substituindo o codificador convencional por uma multiplicação de matriz única e embutido posicional. Esse módulo simplificado fornece consciência espacial ao núcleo de linguagem sem o volume de um codificador de camada intermediária tradicional. O tratamento de áudio é ainda mais radical: sinais raw de áudio são projetados diretamente no mesmo espaço de vetor usado para tokens de texto, eliminando qualquer codificador de áudio dedicado.

Desenvolvedores podem experimentar o Gemma 4 12B sem baixar os arquivos do modelo usando plataformas como LM Studio, Google AI Edge Gallery e interfaces compatíveis. Para aqueles que preferem implantação local, os pesos do modelo — pouco menos de 18 GB — estão disponíveis no Kaggle e Hugging Face. Com o requisito de RAM modesto, pesquisadores e hobbyistas podem executar o modelo em laptops de consumo padrão, abrindo a porta para aplicações de IA privadas e em dispositivos.

Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.