Google le informó a Meta en marzo que su modelo de lenguaje grande Gemini se acercaba a los límites de los recursos de cómputo que el gigante de la búsqueda había asignado a la empresa de medios sociales. Después de que el uso de Meta continuó aumentando, las dos empresas acordaron establecer un límite estricto, según fuentes familiarizadas con el asunto.
Meta depende de Gemini para una variedad de herramientas internas, desde chatbots de servicio al cliente y interfaces de ayuda para anunciantes hasta utilidades de generación de código que asisten a los ingenieros. El modelo también es la base de los sistemas que detectan contenido dañino y marcan estafas. Los funcionarios dijeron que Gemini superó los modelos de Llama de código abierto de Meta, lo que llevó a la decisión de adoptar el servicio de Google a pesar de la falta de una plataforma de nube propia de la empresa.
Sin su propio negocio de nube, Meta ha estado compitiendo para expandir su huella de centro de datos, comprometiéndose a invertir $600 mil millones en infraestructura de nube en los próximos dos años. El rápido crecimiento de la empresa no ha mantenido el ritmo con el apetito de cómputo de inteligencia artificial, lo que la deja dependiente de proveedores externos como Google.
En respuesta a la escasez de capacidad, Google pidió a Meta que mejorara la eficiencia de los tokens. A los empleados se les instruyó que redujeran las llamadas innecesarias al modelo, una medida que busca estirar los recursos disponibles mientras se conserva el rendimiento para las cargas de trabajo críticas.
Google también está sintiendo la presión. El gigante de la búsqueda recientemente acordó un acuerdo de $920 millones por mes con SpaceX para aprovechar los centros de datos de la empresa aeroespacial para su oferta Gemini Enterprise. El acuerdo subraya cómo incluso los proveedores de inteligencia artificial más grandes están luchando por obtener más potencia.
Los analistas de la industria señalan que el aumento en los precios de los tokens ha obligado a muchos usuarios de inteligencia artificial a reducir su uso. Si bien los clientes de alto volumen obtienen los beneficios de modelos más rápidos y capaces, los ingresos generados hasta ahora cubren solo una fracción de los costos de operación. OpenAI, por ejemplo, aún no ha visto beneficios a pesar de su crecimiento rápido.
Meta también ejecuta modelos de Anthropic, como Claude, para tareas similares, diversificando su pila de inteligencia artificial en medio de la escasez de capacidad. La estrategia más amplia de la empresa refleja un cambio hacia un enfoque de múltiples proveedores a medida que el mercado lucha con el suministro limitado de cómputo.
El episodio ilustra una tendencia más amplia: a medida que las aplicaciones de inteligencia artificial se convierten en una parte integral de las operaciones comerciales, la demanda de potencia de procesamiento bruto supera la oferta. Los proveedores están obligados a gestionar las asignaciones de manera estricta, y los clientes como Meta deben adaptarse a controles de uso más estrictos mientras continúan invirtiendo mucho en sus propias capacidades de centro de datos.
Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.