A Google informou à Meta em março que o seu modelo de linguagem grande Gemini estava se aproximando dos limites dos recursos de computação que a gigante de busca havia reservado para a empresa de mídia social. Após o uso da Meta continuar a subir, as duas empresas concordaram em impor um limite rígido, de acordo com fontes familiarizadas com o assunto.

A Meta depende do Gemini para uma variedade de ferramentas internas, desde chatbots de atendimento ao cliente e interfaces de ajuda para anunciantes até utilitários de geração de código que assistem os engenheiros. O modelo também é fundamental para sistemas que detectam conteúdo prejudicial e sinalizam golpes. Funcionários disseram que o Gemini superou os modelos de código aberto Llama da Meta, o que levou à decisão de adotar o serviço da Google, apesar da falta de uma plataforma de nuvem proprietária da empresa.

Sem uma plataforma de nuvem própria, a Meta tem corrido para expandir sua pegada de data center, comprometendo um investimento maciço de US$ 600 bilhões em infraestrutura de nuvem nos próximos dois anos. A construção rápida da empresa não acompanhou o apetite por computação de IA, deixando-a dependente de provedores externos como a Google.

Em resposta à crise de capacidade, a Google pediu à Meta que melhorasse a eficiência dos tokens. Funcionários foram instruídos a reduzir chamadas desnecessárias para o modelo, uma medida que visa esticar os recursos disponíveis enquanto preserva o desempenho para cargas de trabalho críticas.

A Google também está sentindo a pressão. A gigante de busca recentemente fechou um acordo de US$ 920 milhões por mês com a SpaceX para utilizar os data centers da empresa aeroespacial para sua oferta Gemini Enterprise. O acordo destaca como até os maiores provedores de IA estão correndo para obter mais potência.

Analistas da indústria observam que o aumento nos preços dos tokens forçou muitos usuários de IA a reduzir o uso. Embora os clientes de alto volume sejam beneficiados por modelos mais rápidos e capazes, a receita gerada até agora cobre apenas uma fração dos custos operacionais. A OpenAI, por exemplo, ainda não viu lucros apesar de seu crescimento rápido.

A Meta também executa modelos da Anthropic, como o Claude, para tarefas semelhantes, diversificando sua pilha de IA em meio à crise de capacidade. A estratégia mais ampla da empresa reflete uma mudança em direção a uma abordagem de múltiplos fornecedores, à medida que o mercado lida com o fornecimento limitado de computação.

O episódio ilustra uma tendência mais ampla: à medida que as aplicações de IA se tornam fundamentais para as operações comerciais, a demanda por potência de processamento bruto está superando a oferta. Os provedores são compelidos a gerenciar alocações com rigor, e clientes como a Meta devem se adaptar a controles de uso mais rigorosos enquanto continuam a investir pesadamente em suas próprias capacidades de data center.

Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.