En todo el sector tecnológico, las empresas están sintiendo el impacto de los costos de los tokens de IA que han aumentado mucho más allá de las previsiones iniciales del año. Uber, por ejemplo, agotó su presupuesto completo de codificación de IA para 2026 en abril, mientras que Microsoft revocó las licencias de desarrollo de Claude Code para los desarrolladores solo unos meses después de lanzarlas. En Priceline, una renovación de contrato rutinaria para la herramienta Cursor retornó un precio cuatro o cinco veces mayor de lo esperado. Estas sorpresas llegan incluso cuando los precios por token han tendido a disminuir, porque la búsqueda de una adopción más amplia de la IA y el aumento de los agentes autónomos han impulsado el consumo general hacia arriba.

Los ejecutivos que antes medían el éxito de la IA por su capacidad ahora luchan con la visibilidad de los costos. "Seis meses atrás, mis conversaciones con los clientes se centraban en lo que el modelo podía hacer", dijo Alexander Embiricos, jefe de empresa en OpenAI, en un evento reciente en Nueva York. "Ahora el diálogo es sobre el gasto, la auditoría y el control de tokens". El cambio refleja una mayor alarma en la industria: J.R. Storment, director ejecutivo de la Fundación FinOps, escuchó a las empresas informar que estaban tres veces por encima de sus presupuestos de tokens para 2026 ya en abril. "Pasamos de una mentalidad de "ir rápido" a una crisis existencial sobre los límites", le dijo a TechCrunch.

Los nuevos lanzamientos de modelos han amplificado el problema. El Claude Opus 4.5 de Anthropic, el GPT-5.1 de OpenAI y el Gemini 3 Pro de Google todos cuentan con capacidades que alimentan las herramientas de agencia, que a su vez multiplican el uso de tokens. Una empresa informó que acumuló una factura de $500 millones por Claude después de olvidar establecer límites de uso. "Es como la epidemia de cocaína", dijo Chris Reed, director senior de finanzas de IT en Priceline, describiendo cómo el acceso temprano atrae a los equipos a un consumo sin control.

Los desarrolladores no están inmunes al aumento de costos. Una encuesta de marzo de Faros AI entre 20.000 ingenieros encontró que el consumo de tokens por desarrollador aumentó 18,6 veces en nueve meses, incluso cuando la producción aumentó. Jellyfish informó que los ingenieros que usaban la mayoría de los tokens eran aproximadamente dos veces más productivos, pero gastaban diez veces más tokens para lograr esa ventaja. Nicholas Arcolano, jefe de investigación en Jellyfish, advirtió que los beneficios de productividad son difíciles de traducir en valor empresarial medible, lo que deja a muchas empresas inciertas sobre el ROI.

Seguir el gasto de tokens presenta un desafío intensivo en datos. Storment lo comparó con un problema de "billones de filas al mes", mucho más allá de las capacidades de las hojas de cálculo o herramientas básicas. Ya surgieron discrepancias; Reed señaló discrepancias entre el uso informado por los proveedores y los datos internos de Priceline, que recuerdan a los errores de facturación conocidos en la gestión de gastos de telecomunicaciones y cloud.

Para abordar la brecha, está surgiendo un mercado de proveedores especializados. Empresas como Pay-i y Paid ofrecen plataformas que monitorean, miden y optimizan el gasto en IA a nivel de token. Los jugadores existentes como Jellyfish, Waydev y Faros AI están agregando monitoreo de agentes de IA para demostrar el ROI de las herramientas de desarrollador. Las empresas más grandes con canales de distribución establecidos —Ramp, Datadog, New Relic— están agregando características de gestión de costos de IA a sus suites. En la próxima conferencia FinOps X, se espera que AWS presente nuevas capacidades de gestión financiera dirigidas al gasto empresarial en IA.

Aun así, sin un lenguaje común, estas soluciones riesgos de hablar más allá una de la otra. La Fundación Tokenomics, un nuevo organismo de estándares bajo la Linux Foundation, tiene como objetivo llenar ese vacío. Su carta incluye definir un marco de "tokenomía" canónico, establecer especificaciones abiertas para el uso y la facturación de tokens de IA, e introducir métricas como el costo por inteligencia y tokens por vatio. El grupo planea un lanzamiento formal en julio y anunciará miembros adicionales en FinOps X.

Líderes de la industria ven el esfuerzo como esencial. Nishant Gupta, jefe de disponibilidad en Salesforce, advirtió que la economía de tokens es "fundamentalmente más abstracta y opaca" que cualquier disciplina de costos en la nube que la industria haya gestionado antes. Goldman Sachs proyecta que el uso global de tokens aumentará 24 veces para 2030, lo que subraya la urgencia de controles de costos robustos.

Mientras que los primeros entregables de la Fundación Tokenomics aún están meses por venir, las empresas que ya están por encima del presupuesto están buscando alivio inmediato. Los expertos sugieren que el mayor ROI puede provenir de mover a la amplia mayoría de los usuarios de un uso bajo a moderado, en lugar de empujar a los usuarios intensivos aún más alto. A medida que la economía de la IA madura, las herramientas y los estándares que surgen hoy darán forma a cómo las empresas equilibran la innovación con la responsabilidad fiscal.

Este artículo fue escrito con la asistencia de IA.
News Factory SEO te ayuda a automatizar contenido de noticias para tu sitio.