Jensen Huang, director ejecutivo de Nvidia, advirtió en el podcast Dwarkesh que la decisión de DeepSeek de optimizar su próximo modelo de fundación V4 para el procesador Ascend 950PR de Huawei sería "un resultado horrible" para Estados Unidos. El comentario subraya una creciente preocupación en Washington de que China podría erosionar la brecha de software y hardware que ha mantenido a las empresas estadounidenses a la vanguardia del desarrollo de inteligencia artificial durante más de una década.
DeepSeek, el laboratorio de inteligencia artificial más avanzado de China, está a punto de lanzar V4 a finales de este mes. Según The Information, el modelo multimodal se ejecutará en el chip Ascend 950PR de Huawei, mientras que Reuters informó que el entrenamiento puede haber tenido lugar en las GPU Blackwell de Nvidia. Las dos declaraciones no son mutuamente excluyentes; un modelo puede ser entrenado en una plataforma y desplegado para inferencia en otra. Lo que hace que el movimiento sea significativo es la migración de DeepSeek desde el marco de software CUDA de Nvidia al marco de software CANN de Huawei.
CUDA se ha convertido en el entorno de desarrollo de facto para la inteligencia artificial. Virtualmente todos los modelos fronterizos fuera de China están construidos en GPU de Nvidia utilizando CUDA, lo que da a Estados Unidos una capa de control que se extiende más allá de los chips en sí. Al reescribir su código principal para CANN, DeepSeek está rompiendo esa dependencia. Si el modelo V4 funciona bien en silicio Ascend, demostraría que los sistemas de inteligencia artificial competitivos pueden ser construidos sin ningún hardware de Nvidia, lo que cuestiona el principio de las políticas actuales de control de exportaciones.
Los chips de Huawei están por detrás de las ofertas principales de Nvidia. El predecesor Ascend 910C entrega aproximadamente el 60% del rendimiento de inferencia de la H100 de Nvidia, y se proyecta que la brecha de rendimiento se ampliará a 17 veces para 2027. Sin embargo, Huang argumentó que la potencia de hardware cruda es solo una variable. La energía abundante de China, el gran grupo de investigadores de inteligencia artificial y ahora una pila de software viable podrían permitirle cerrar la brecha incluso con silicio inferior.
El historial de DeepSeek agrega peso al debate. Su modelo V3, lanzado a finales de 2024, se entrenó en 2.048 GPU H800 de Nvidia, chips diseñados específicamente para el mercado chino pero prohibidos para su venta a China en 2023. El modelo de razonamiento R1 del laboratorio igualó o superó el rendimiento de contrapartes occidentales mucho más costosas. Sin embargo, el modelo R2 de la empresa tropezó durante el entrenamiento en hardware de Huawei, lo que obligó a regresar a las GPU de Nvidia para la fase más intensiva en computación. La distinción es importante: el entrenamiento demanda el rendimiento más alto, mientras que la inferencia, donde se realiza el valor comercial, puede ser servida adecuadamente por los chips de Huawei.
Los legisladores estadounidenses están observando la situación de cerca. El jueves, varios miembros del Congreso y expertos en tecnología pidieron que DeepSeek, junto con Moonshot AI y MiniMax, sean colocados en la lista de entidades, argumentando que el cambio del laboratorio hacia hardware doméstico podría socavar las restricciones de exportación de EE. UU. Nvidia misma ha reiniciado la producción de su chip H200 para el mercado chino, pero los compradores chinos han bloqueado en gran medida las importaciones para proteger el negocio de chips doméstico de Huawei.
La advertencia de Huang apunta finalmente al diseño de software y hardware que ha convertido a Nvidia en el eje de la cadena de suministro global de inteligencia artificial. La dominancia de CUDA significa que los gobiernos, las empresas y los investigadores compran GPU de Nvidia porque el ecosistema de software lo exige. Un ecosistema paralelo construido alrededor de CANN podría cambiar esa ecuación, reduciendo la demanda de GPU de centro de datos de Nvidia y debilitando la justificación para controles de exportación estrictos.
Las apuestas son concretas. La capitalización de mercado de Nvidia supera los 3 billones de dólares, y sus ingresos de centro de datos crecieron un 93% año tras año en el último trimestre. Si el modelo V4 de DeepSeek resulta competitivo en silicio de Huawei, el argumento para la continuación de la dependencia del hardware de Nvidia, y las políticas construidas alrededor de esa dependencia, podría perder tracción.
Mientras que los chips de Huawei siguen estando muy por detrás de los de Nvidia en rendimiento crudo, la preocupación real es la trayectoria. Si el modelo de DeepSeek funciona efectivamente en procesadores Ascend, otros laboratorios chinos pueden seguir, erosionando la brecha de CUDA que ha mantenido a Nvidia en la cima del mercado de hardware de inteligencia artificial. La admonición pública de Huang sugiere que cree que el riesgo ya no es teórico, sino inminente.
Este artigo foi escrito com a assistência de IA.
News Factory SEO ajuda você a automatizar conteúdo de notícias para o seu site.