General Compute, um provedor de nuvem de inferência de IA em crescimento, fechou uma rodada de financiamento de semente de US$ 15 milhões em uma valorização pós-dinheiro de US$ 60 milhões. A rodada foi liderada pela FUSE VC e incluiu a Carya Venture Partners e a Village Global Ventures. O financiamento acelerará o lançamento do serviço "neocloud" da empresa, que aluga poder de processamento para a fase da IA em que os modelos geram respostas em vez de aprender com os dados.
Os fundadores da startup, CEO Finn Puklowski e CTO Jason Goodison, citam dois gargalos persistentes no ecossistema de IA: encontrar o chip certo para cargas de trabalho de inferência e localizar espaço de centro de dados que possa hospedar esse hardware sem atualizações de infraestrutura maciças. Embora as GPUs tenham dominado o treinamento de IA, elas são menos eficientes para a inferência, levando a indústria a explorar silício personalizado.
Chips SambaNova impulsionam o novo neocloud
General Compute parceirou-se com a SambaNova, uma fabricante de chips apoiada pela Intel que se concentra na inferência. Os chips SN50 da SambaNova prometem 600-700 tokens por segundo, aproximadamente três vezes a taxa de transferência de GPUs convencionais, que gerenciam cerca de 250 tokens por segundo. Os chips também apresentam uma arquitetura flexível e buffers de memória maiores, permitindo que eles armazenem mais contexto durante os cálculos.
Ao contrário de muitos aceleradores de IA de alto desempenho que exigem refrigeração a água e uma quantidade substancial de energia, o SN50 é refrigerado a ar e consome menos eletricidade. Esse design permite que o hardware seja instalado em instalações de centro de dados existentes sem nova infraestrutura de refrigeração. Puklowski afirma que a empresa já encomendou US$ 300 milhões em unidades SN50 e será a primeira neocloud a implantá-las em larga escala.
Para superar o segundo obstáculo - encontrar espaço de rack adequado - General Compute está buscando acordos de colocalização. A empresa planeja colocar seu hardware não apenas em sites de centro de dados tradicionais, mas também em operações de mineração de criptomoedas repurposadas, onde a capacidade excessiva pode ser redirecionada para cargas de trabalho de IA. Essa abordagem reflete tendências recentes em que os mineradores alugam hardware ocioso para tarefas de computação alternativas.
General Compute lançou sua oferta de nuvem na semana passada, anunciando o desempenho mais rápido no MiniMax 2.7, um modelo de linguagem grande de código aberto. O investidor de venture Joe Hasselmann, que apoiou a startup por meio de seu novo fundo de capital focado em IA, Evercrest Capital Partners, vê a parceria SambaNova como um paralelo estratégico a colaborações anteriores, como a dependência da CoreWeave em GPUs da Nvidia e a integração da Groq de seus próprios chips com serviços de nuvem.
Observadores da indústria notam que a mudança em direção a hardware de inferência especializado reflete uma realinhamento mais amplo do mercado. Empresas como Cerebras e Groq recentemente garantiram financiamentos maciços ou procedimentos de IPO, sublinhando a demanda por inferência mais rápida e mais barata. À medida que as aplicações de IA mudam de implantações de modelo único para ecossistemas de multiagente, a velocidade e o custo se tornam fatores competitivos decisivos.
Puklowski imagina transformar trabalhos de inferência de hora em tarefas que terminam em cinco a dez minutos. A geração de token mais rápida também permite agentes de áudio mais responsivos para casos de uso de atendimento ao cliente. "Se você usa o ChatGPT e ele fornece 50 tokens por segundo, isso ainda é muito mais rápido do que podemos ler", disse ele, destacando a necessidade de inferência rápida à medida que os agentes de IA se tornam mais autônomos.
A rodada de financiamento de semente não apenas fornece o capital para comprar e implantar a frota SN50, mas também valida o modelo de negócios da General Compute, que depende de entregar inferência de alto débito e baixo custo para um roster crescente de clientes. Com o apoio de investidores experientes e uma clara vantagem de hardware, a empresa parece estar bem posicionada para capturar uma fatia do mercado de inferência em crescimento.
Este artigo foi escrito com a assistência de IA.
News Factory SEO ajuda você a automatizar conteúdo de notícias para o seu site.