Em todo o setor de tecnologia, as empresas estão sentindo o impacto de contas de tokens de IA que inflaram muito além das previsões do início do ano. A Uber, por exemplo, esgotou todo o seu orçamento de codificação de IA para 2026 em abril, enquanto a Microsoft revogou licenças de desenvolvedor para o Claude Code apenas meses após lançá-las. Na Priceline, uma renovação de contrato rotineira para a ferramenta Cursor retornou um preço quatro a cinco vezes maior do que o esperado. Essas surpresas ocorrem mesmo com as taxas por token tendo diminuído, porque a pressão para uma adoção mais ampla de IA e o aumento de agentes autônomos impulsionaram o consumo geral para cima.
Executivos que antes mediam o sucesso da IA pela capacidade agora lutam com a visibilidade dos custos. "Seis meses atrás, minhas conversas com clientes se concentravam no que o modelo podia fazer", disse Alexander Embiricos, chefe de empresa da OpenAI, em um evento recente em Nova York. "Agora o diálogo é sobre gastos, auditoria e controles de token." A mudança reflete um pânico mais amplo na indústria: J.R. Storment, diretor executivo da FinOps Foundation, ouviu empresas relatarem estar três vezes acima de seus orçamentos de token para 2026 já em abril. "Passamos de uma mentalidade de "ir rápido" para uma crise existencial sobre limites", ele disse à TechCrunch.
Lançamentos de novos modelos amplificaram o problema. O Claude Opus 4.5 da Anthropic, o GPT-5.1 da OpenAI e o Gemini 3 Pro do Google todos possuem capacidades que alimentam ferramentas agênticas, que por sua vez multiplicam o uso de tokens. Uma empresa relatou ter acumulado uma conta de US$ 500 milhões com o Claude após esquecer de definir limites de uso. "É como a epidemia de cocaína", disse Chris Reed, diretor sênior de finanças de TI da Priceline, descrevendo como o acesso antecipado seduz equipes para um consumo descontrolado.
Desenvolvedores não estão imunes ao esprial de custos. Uma pesquisa da Faros AI com 20.000 engenheiros em março encontrou que o consumo de tokens por desenvolvedor aumentou 18,6 vezes em nove meses, mesmo com a produtividade aumentando. A Jellyfish relatou que os engenheiros que usaram mais tokens foram aproximadamente duas vezes mais produtivos, mas gastaram dez vezes mais tokens para alcançar essa vantagem. Nicholas Arcolano, chefe de pesquisa da Jellyfish, alertou que os ganhos de produtividade são difíceis de traduzir em valor comercial mensurável, deixando muitas empresas incertas sobre o ROI.
Rastrear o gasto com tokens apresenta um desafio intensivo em dados. Storment comparou isso a um problema de "trilhões de linhas por mês", muito além das capacidades de planilhas ou ferramentas básicas. Discrepâncias já surgem; Reed notou discrepâncias entre o uso relatado pelos fornecedores e os dados internos da Priceline, ecoando erros de faturamento familiares da gestão de despesas de telecomunicações e nuvem.
Para abordar a lacuna, um mercado de fornecedores especializados está surgindo. Empresas como Pay-i e Paid oferecem plataformas que monitoram, medem e otimizam o gasto com IA no nível de token. Jogadores existentes como Jellyfish, Waydev e Faros AI estão adicionando monitoramento de agentes de IA para demonstrar ROI em ferramentas de desenvolvedor. Empresas maiores com canais de distribuição estabelecidos — Ramp, Datadog, New Relic — estão adicionando recursos de gerenciamento de custos de IA a seus conjuntos. Na próxima conferência FinOps X, a AWS deve anunciar novas capacidades de gerenciamento financeiro destinadas ao gasto com IA de empresas.
No entanto, sem uma linguagem comum, essas soluções arriscam falar além umas das outras. A Fundação Tokenomics, um novo órgão de padronização sob a Linux Foundation, visa preencher esse vazio. Sua carta inclui definir um quadro canônico de "tokenômica", estabelecer especificações abertas para uso e faturamento de tokens de IA e introduzir métricas como custo por inteligência e tokens por watt. O grupo planeja um lançamento formal em julho e anunciará membros adicionais na FinOps X.
Líderes da indústria veem a iniciativa como essencial. Nishant Gupta, chefe de disponibilidade da Salesforce, alertou que a economia de tokens é "fundamentalmente mais abstrata e opaca" do que qualquer disciplina de custo de nuvem que a indústria já gerenciou antes. O Goldman Sachs projeta que o uso global de tokens multiplicará 24 vezes até 2030, sublinhando a urgência para controles de custos robustos.
Embora as primeiras entregas da Fundação Tokenomics ainda estejam meses à frente, empresas já acima do orçamento estão se apressando em busca de alívio imediato. Especialistas sugerem que o maior ROI pode vir de mover o amplo meio dos usuários de um uso baixo para um uso moderado, em vez de impulsionar usuários pesados ainda mais. À medida que a economia de IA amadurece, as ferramentas e padrões que surgem hoje moldarão como as empresas equilibram inovação com responsabilidade fiscal.
Este artigo foi escrito com a assistência de IA.
News Factory SEO ajuda você a automatizar conteúdo de notícias para o seu site.