Seis meses após a Nvidia fechar um acordo de $20 bilhões que pagou em dinheiro aos investidores da Groq, contratou vários engenheiros seniores e licenciou a tecnologia de chip da empresa, a Groq anunciou uma rodada de financiamento de $650 milhões. O capital vem dos mesmos investidores que receberam o pagamento em dezembro, com a Disruptive e a Infinitium se comprometendo a apoiar a rodada se outros parceiros limitados declinarem suas ações pro-rata. Em essência, a rodada está garantida.

O CEO interino Adam Winter e o CFO Matt Eng estão liderando a empresa através do que resta de seu negócio: um serviço de nuvem de inferência construído sobre o hardware de Unidade de Processamento de Linguagem (LPU) proprietário da Groq. O serviço permite que desenvolvedores e empresas executem cargas de trabalho pesadas de inferência - como consultas do ChatGPT, respostas do Claude ou ações de agentes impulsionados por IA - em silício dedicado que promete menores custos de token e maior velocidade do que GPUs de propósito geral.

A arquitetura LPU da Groq foi projetada especificamente para inferência em nível de token. A empresa já enviou chips para vários provedores de modelo e clientes de nuvem, e benchmarks independentes consistentemente mostram taxas de token por segundo que superam as ofertas baseadas em GPU da Nvidia em pontos de preço comparáveis. Essa vantagem de desempenho é o núcleo da proposta de valor da Groq à medida que busca escalar sua plataforma de nuvem.

O mercado de hardware de inferência está esquentando. A Cerebras foi pública com uma valorização de $95 bilhões em uma apresentação focada em inferência, a Fractile levantou $220 milhões em Londres para chips que integram computação e memória em um único die, e o Google está implantando milhões de TPUs Ironwood construídos para cargas de trabalho de inferência. Ao mesmo tempo, os provedores de modelo estão reduzindo os preços de API - a DeepSeek reduziu seu preço V4 Pro em 75 por cento - pressionando os provedores de nuvem a manter os custos de token baixos.

A Nvidia não está parada. Suas arquiteturas Blackwell e Vera Rubin em breve devem estreitar a lacuna de desempenho que uma vez deu às empresas como a Groq um ponto de apoio. A captação de $650 milhões é uma aposta de que o silício de inferência personalizado ainda mantém uma vantagem durável, mesmo à medida que a Nvidia impulsiona suas próprias capacidades para frente.

Se a Groq pode reconstruir sua liderança de engenharia, expandir sua pegada de nuvem e preservar uma vantagem de custo contra tanto as atualizações de hardware da Nvidia quanto os preços agressivos dos provedores de modelo ainda está para ser visto. Os investidores que foram pagos a uma valorização de $20 bilhões agora estão sendo solicitados a apostar novamente em uma versão mais enxuta da empresa. Dois deles já se comprometeram a garantir a rodada, sinalizandoEither uma forte convicção na tecnologia ou um senso de obrigação de ver o negócio até o fim.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.

Groq asegura $650 millones para reconstruir su nube de inferencia después del acuerdo con Nvidia

Key Points

También disponible en: