Jensen Huang, CEO da Nvidia, alertou em um podcast que a decisão da DeepSeek de otimizar seu próximo modelo de fundação V4 para o processador Ascend 950PR da Huawei seria um "resultado horrível" para os EUA. O comentário destaca uma crescente preocupação em Washington de que a China possa erodir a barreira de software e hardware que manteve as empresas americanas à frente do desenvolvimento de inteligência artificial por mais de uma década.
A DeepSeek, o laboratório de IA mais avançado da China, está prestes a lançar o V4 este mês. De acordo com The Information, o modelo multimodal será executado no chip Ascend 950PR da Huawei, enquanto a Reuters relatou que o treinamento pode ter ocorrido em GPUs Blackwell da Nvidia. As duas afirmações não são mutuamente exclusivas; um modelo pode ser treinado em uma plataforma e implantado para inferência em outra. O que torna a mudança significativa é a migração da DeepSeek do framework CUDA da Nvidia para o framework CANN da Huawei.
O CUDA se tornou o ambiente de desenvolvimento de facto para IA. Virtualmente todos os modelos de fronteira fora da China são construídos em GPUs da Nvidia usando CUDA, dando aos EUA uma camada de controle que se estende além dos próprios chips. Ao reescrever seu código-fonte para o CANN, a DeepSeek está quebrando essa dependência. Se o modelo V4 performar bem em silício Ascend, demonstraria que sistemas de IA competitivos podem ser construídos sem qualquer hardware da Nvidia, desafiando a premissa das atuais políticas de controle de exportação.
Os chips da Huawei estão atrasados em relação às ofertas de ponta da Nvidia. O predecessor Ascend 910C entrega cerca de 60% do desempenho de inferência da Nvidia H100, e a lacuna de desempenho é projetada para se ampliar para 17 vezes até 2027. No entanto, Huang argumentou que o poder bruto do hardware é apenas uma variável. A abundância de energia da China, o grande pool de pesquisadores de IA e, agora, uma pilha de software viável poderiam permitir que a China se aproximasse mesmo com silício inferior.
O histórico da DeepSeek adiciona peso ao debate. Seu modelo V3, lançado no final de 2024, foi treinado em 2.048 GPUs H800 da Nvidia - chips projetados especificamente para o mercado chinês, mas proibidos de serem vendidos para a China em 2023. O modelo de raciocínio R1 da empresa igualou ou superou o desempenho de contrapartes ocidentais muito mais caras. No entanto, o modelo R2 da empresa tropeçou durante o treinamento em hardware da Huawei, forçando um retorno às GPUs da Nvidia para a fase mais intensiva de computação. A distinção é importante: o treinamento exige o melhor desempenho, enquanto a inferência - onde o valor comercial é realizado - pode ser adequadamente atendida pelos chips da Huawei.
Os legisladores dos EUA estão observando a situação de perto. Na quinta-feira, vários membros do Congresso e especialistas em tecnologia pediram que a DeepSeek, juntamente com a Moonshot AI e a MiniMax, fossem incluídas na lista de controle de exportação, argumentando que a mudança do laboratório para hardware nacional poderia minar as restrições de exportação dos EUA. A própria Nvidia reiniciou a produção de seu chip H200 para o mercado chinês, mas os compradores chineses bloquearam largamente as importações para proteger o negócio de chips doméstico da Huawei.
A advertência de Huang visa, em última análise, o co-design de software e hardware que tornou a Nvidia o pino central da cadeia de suprimentos global de IA. A dominância do CUDA significa que governos, empresas e pesquisadores todos compram GPUs da Nvidia porque o ecossistema de software exige isso. Um ecossistema paralelo construído em torno do CANN poderia alterar essa equação, reduzindo a demanda por GPUs de centro de dados da Nvidia e enfraquecendo a justificativa para controles de exportação rigorosos.
As apostas são concretas. A capitalização de mercado da Nvidia ultrapassa US$ 3 trilhões, e sua receita de centro de dados cresceu 93% ano a ano no último trimestre. Se o V4 da DeepSeek se provar competitivo em silício da Huawei, o argumento para a continuação da dependência de hardware da Nvidia - e as políticas construídas em torno dessa dependência - poderia perder tração.
Embora os chips da Huawei ainda estejam muito atrás dos da Nvidia em desempenho bruto, a preocupação real é a trajetória. Se o modelo da DeepSeek executar efetivamente em processadores Ascend, outros laboratórios chineses podem seguir, erodindo a barreira CUDA que manteve a Nvidia no ápice do mercado de hardware de IA. A advertência pública de Huang sugere que ele acredita que o risco não é mais teórico, mas iminente.
Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory SEO hilft Ihnen, Nachrichteninhalte für Ihre Website zu automatisieren.