Google apresentou o Gemma 4 12B, um modelo de linguagem grande com 12 bilhões de parâmetros que oferece quase paridade com seu irmão de 26 bilhões de parâmetros, enquanto se encaixa em um laptop com 16 GB de RAM. O modelo introduz redatores de Previsão de Múltiplos Tokens (MTP) para geração de tokens mais rápida e eficiente e um embutido de visão simplificado que remove codificadores volumosos. As entradas de áudio contornam a codificação por completo, permitindo que sinais raw sejam alimentados diretamente no modelo. Pesos, com pouco menos de 18 GB, estão disponíveis para download no Kaggle e Hugging Face, e o modelo pode ser acessado por meio do LM Studio, Google AI Edge Gallery e ferramentas semelhantes.
Ler mais