OpenAI, a criadora do ChatGPT e de outras ferramentas de large-language-model, e Broadcom, um veteranos fornecedor de silício, revelaram um chip personalizado chamado Jalapeño na quarta-feira. O anúncio posiciona o chip como a primeira geração de um esforço de vários anos para entregar hardware ajustado especificamente para cargas de trabalho de inferência de LLM em data centers de grande escala.

Jalapeño tem como alvo as demandas computacionais intensivas de modelos de linguagem modernos, que atualmente dependem de sistemas de inferência de propósito geral. Ao se concentrar nas características únicas das cargas de trabalho de LLM, o chip visa reduzir o consumo de energia enquanto mantém ou melhora a produtividade.

Broadcom descreveu o ASIC como o produto de "insights detalhados" coletados durante conversas extensivas com as equipes de pesquisa da OpenAI. Essas discussões informaram a arquitetura do chip, alinhando-a com a estratégia da OpenAI para futuros modelos e produtos. A colaboração reflete um nível rare de co-design entre um laboratório de IA líder e um fabricante de hardware.

Desde o conceito até o silício, o projeto levou nove meses. Dentro desse período, a Broadcom projetou o chip do zero, integrando feedback da OpenAI em cada etapa. Ambas as empresas enfatizam que o ciclo de desenvolvimento rápido demonstra como os parceiros trabalharam juntos.

De acordo com as empresas, a especialização do Jalapeño o distingue dos processadores que atualmente alimentam a inferência de LLM. O hardware de data center existente frequentemente equilibra uma ampla gama de tarefas de IA, enquanto o Jalapeño se concentra nos padrões de inferência típicos de grandes modelos de linguagem. Essa concentração, dizem eles, se traduz em maior eficiência.

Os testes iniciais da OpenAI indicam que o chip entrega um "desempenho por watt substancialmente melhor que as soluções atuais de ponta". Embora as figuras exatas permaneçam em sigilo, a declaração sugere um salto significativo na eficiência energética, uma métrica crítica para operadores que executam cargas de trabalho de IA caras e consumidoras de energia.

As empresas advertiram que as medições de desempenho formais ainda estão em andamento. Um relatório técnico abrangente, prometeram, será lançado nos próximos meses para detalhar os resultados dos benchmarks e as escolhas arquitetônicas.

Ambos os parceiros veem o Jalapeño como o ponto de partida de uma jornada mais longa. Eles imaginam refinamentos iterativos que manterão o ritmo com a evolução rápida das arquiteturas de LLM. Gerações futuras do chip devem incorporar lições aprendidas com implantações no mundo real e com os designs de modelos de próxima geração da OpenAI.

Observadores da indústria notam que um chip de inferência de LLM dedicado pode alterar a economia da implantação de IA, especialmente à medida que as empresas escalonam serviços de modelo de linguagem. Se o Jalapeño cumprir suas promessas iniciais, os operadores de data center podem ver custos operacionais mais baixos e uma pegada de carbono menor, enquanto os desenvolvedores de IA ganham acesso a hardware que atende às demandas de modelos cada vez maiores.

Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory APP - agentische News für besseres SEO & AEO.