Justo un año después de que las empresas convirtieron el uso de la IA en un deporte competitivo, la marea está cambiando. Los ejecutivos que anteriormente se jactaban del número de tokens quemados por su personal ahora enfrentan una creciente presión para contener los gastos. El cambio, denominado "tokenminimizando", refleja una mirada crítica a los presupuestos que han inflado a niveles insostenibles.

AT&T ha comenzado a restringir el acceso a GitHub Copilot para ciertos empleados, según un informe de The Information. Meta está reportadamente endureciendo las limitaciones sobre el gasto del personal para Anthropic y otros servicios de IA, revirtiendo un período en el que los ingenieros competían por consumir la mayor cantidad de tokens. Uber, que agotó su presupuesto completo de codificación de IA para 2026 en abril, ahora limita a cada empleado a $1,500 por mes por herramienta. Walmart ha colocado límites en su agente de IA propio, y Amazon ha desmantelado un tablero de liderazgo interno que anteriormente clasificaba a los trabajadores por su uso de IA después de descubrir que el sistema estaba siendo manipulado, lo que impulsaba los costos de cómputo hacia arriba.

Empresas imponen límites y nuevas herramientas de monitoreo

El detonante de estos movimientos es simple: las facturas eran aterradoras. Algunas de las empresas más obsesionadas con la IA han estado gastando aproximadamente $7,500 por empleado cada mes. Las herramientas agénticas que llaman repetidamente a un modelo han duplicado los gastos de IA empresariales incluso cuando los precios por token han caído. Microsoft descubrió ingenieros cuyo gasto mensual en tokens de Claude Code variaba desde $500 hasta $2,000, lo que llevó a revisiones internas.

Para mantener un control sobre los costos sin frenar la productividad, las empresas están recurriendo a nuevas soluciones de monitoreo. Microsoft y Databricks han introducido herramientas "de puerta de enlace" que rastrean y limitan el gasto de IA en tiempo real. Factory, respaldada por Nvidia y valorada en $1.5 mil millones, lanzó un enrutador de modelos que dirige automáticamente tareas más simples a modelos más baratos o de código abierto, efectivamente intercambiando modelos de frontera costosos por alternativas más económicas.

El CEO de Box, Aaron Levie, elogió el cambio, diciendo que la empresa nunca ejecutó tableros de liderazgo de token-maxxing y, por lo tanto, evitó incentivar un comportamiento derrochador. En contraste, un líder de ingeniería en Databricks señaló que el presupuesto de IA para ingenieros sigue siendo ilimitado, sugiriendo que algunos equipos aún operan bajo una mentalidad de token-maxxing.

La tensión es clara: los límites pueden salvaguardar los presupuestos, pero también pueden frenar los aumentos de productividad que inicialmente justificaron el gasto. Satya Nadella capturó el estado de ánimo en un ensayo de fin de semana, argumentando que los modelos de IA deberían ser intercambiables en lugar de dominantes. Advirtió contra un futuro en el que unos pocos modelos monopolizan el valor en todos los sectores, una preocupación que resuena en empresas cuyo software depende de los mismos laboratorios que ahora buscan limitar.

En última instancia, el movimiento hacia el token-minimizando está redefiniendo cómo las empresas abordan la IA. Al implementar límites de gasto, desplegar monitoreo en tiempo real y favorecer modelos más baratos o de código abierto para tareas rutinarias, las empresas buscan preservar los beneficios de la IA mientras evitan desbordamientos presupuestarios. La era del consumo ilimitado de tokens puede estar terminando, pero la búsqueda de un uso eficiente y rentable de la IA apenas comienza.

Questo articolo è stato scritto con l'assistenza dell'IA.
News Factory APP - notizie agentiche per potenziare il tuo SEO e AEO.