Apenas um ano após as empresas transformarem o uso de IA em um esporte competitivo, a maré está mudando. Executivos que outrora se vangloriavam do número de tokens consumidos por seus funcionários agora enfrentam pressão crescente para controlar os gastos. A mudança, apelidada de 'token-minimizando', reflete um exame rigoroso dos orçamentos que haviam inflado a níveis insustentáveis.

AT&T começou a restringir o acesso ao GitHub Copilot para certains funcionários, de acordo com um relatório da The Information. Meta está supostamente apertando os controles sobre os gastos dos funcionários para Anthropic e outros serviços de IA, revertendo um período em que os engenheiros competiam para consumir o maior número de tokens. Uber, que esgotou todo o seu orçamento de codificação de IA para 2026 em abril, agora limita cada funcionário a $1.500 por mês por ferramenta. Walmart impôs limites ao seu agente de IA proprietário, e Amazon desmantelou um líder interno que outrora classificava os funcionários por uso de IA após descobrir que o sistema estava sendo manipulado, impulsionando os custos de processamento para cima.

Empresas impõem limites e novas ferramentas de monitoramento

O motivo dessas mudanças é simples: as contas eram assustadoras. Algumas das empresas mais obsessivas com IA estavam gastando cerca de $7.500 por funcionário por mês. Ferramentas agênticas que chamam repetidamente um modelo dobraram os gastos de IA empresariais, mesmo com os preços por token caindo. Microsoft descobriu engenheiros cujo gasto mensal de tokens Claude Code variava de $500 a $2.000, o que levou a revisões internas.

Para manter os custos sob controle sem prejudicar a produtividade, as empresas estão recorrendo a novas soluções de monitoramento. Microsoft e Databricks introduziram ferramentas 'gateway' que rastreiam e limitam os gastos de IA em tempo real. A Factory, apoiada pela Nvidia e avaliada em $1,5 bilhão, lançou um roteador de modelo que direciona automaticamente tarefas mais simples para modelos mais baratos ou de código aberto, efetivamente substituindo modelos de fronteira caros por alternativas mais econômicas.

O CEO da Box, Aaron Levie, elogiou a mudança, dizendo que a empresa nunca executou líderes de token-maxxing e, portanto, evitou incentivar comportamentos excessivos. Em contraste, um líder de engenharia da Databricks observou que o orçamento de IA para engenheiros permanece ilimitado, sugerindo que algumas equipes ainda operam sob uma mentalidade de token-maxxing.

A tensão é clara: os limites podem proteger os orçamentos, mas também podem limitar os ganhos de produtividade que inicialmente justificaram os gastos. Satya Nadella capturou o clima em um ensaio de fim de semana, argumentando que os modelos de IA devem ser intercambiáveis em vez de dominantes. Ele alertou contra um futuro em que alguns modelos monopolizem o valor em todos os setores, uma preocupação que ressoa com as empresas cujo software depende dos próprios laboratórios que agora buscam limitar.

Em última análise, a mudança para o token-minimizando está redesenhando a forma como as empresas abordam a IA. Ao impor limites de gastos, implantar monitoramento em tempo real e favorecer modelos mais baratos ou de código aberto para tarefas rotineiras, as empresas visam preservar os benefícios da IA enquanto evitam excessos orçamentários. A era do consumo irrestrito de tokens pode estar terminando, mas a busca por um uso eficiente e economicamente viável de IA está apenas começando.

Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory APP - agentische News für besseres SEO & AEO.