A OpenAI revelou seu primeiro silício personalizado na quarta-feira, apresentando um novo processador de inferência chamado Jalapeño. O chip surgiu de uma colaboração com a Broadcom, que lidou com o design e a fabricação. Diferentemente das GPUs de propósito geral, o Jalapeño é projetado especificamente para as cargas de trabalho que impulsionam os serviços da OpenAI, como assistentes de codificação em tempo real e agentes conversacionais.

De acordo com a empresa, os testes iniciais mostram que o processador entrega um desempenho significativamente maior por watt do que as alternativas de última geração atualmente em uso. Esse aumento de eficiência pode se traduzir em menores custos operacionais para as ofertas de IA baseadas em nuvem da OpenAI, especialmente aquelas que dependem fortemente da inferência em vez da fase de treinamento mais intensiva em computação.

O presidente da OpenAI, Greg Brockman, explicou a razão na podcast interna da empresa. Ele disse que a equipe utilizou seus próprios modelos para informar a arquitetura do chip, visando cargas de trabalho que o hardware existente "subatende". Ao projetar o silício internamente, a OpenAI espera fechar a lacuna entre software e hardware, garantindo que cada camada da pilha trabalhe em direção ao mesmo objetivo: IA mais rápida, confiável e acessível.

A parceria com a Broadcom foi anunciada pela primeira vez em outubro, mas os detalhes do chip permaneceram em segredo até a briefing de quarta-feira. Observadores da indústria especularam há muito tempo que a OpenAI buscaria uma solução personalizada para reduzir sua dependência das GPUs da Nvidia, uma estratégia já perseguida por rivais como Google e Amazon, que construíram seus próprios aceleradores de IA.

O foco do Jalapeño está inteiramente na inferência — executar modelos pré-treinados em resposta a consultas de usuários. A OpenAI destacou a baixa potência do chip ao lidar com modelos de codificação em tempo real, sugerindo que até economias modestas poderiam ter um impacto significativo na linha de fundo da empresa. O pré-treinamento, que permanece computacionalmente exigente, provavelmente continuará a depender do hardware da Nvidia por um futuro previsível.

Além do próprio chip, a OpenAI enfatizou que a movimentação reflete uma ambição mais ampla de possuir a infraestrutura que subjaz a seus produtos. A declaração da empresa observou que está "projetando a infraestrutura por baixo" de seus modelos, desde a arquitetura do chip e sistemas de memória até redes e agendamento. Ao controlar esses componentes, a OpenAI visa otimizar cada etapa da pipeline de IA.

Analistas da indústria veem o desenvolvimento como um momento crucial na economia da inteligência artificial. À medida que os serviços de IA escalonam, o custo da inferência se torna um fator importante na rentabilidade. Um processador mais eficiente pode reduzir o preço das APIs de IA em nuvem, potencialmente tornando capacidades avançadas mais acessíveis a desenvolvedores e empresas.

A OpenAI já integrou seus modelos em uma suíte de produtos agênticos, incluindo o Codex, que impulsiona ferramentas de geração de código, e outras interfaces conversacionais. A adição do Jalapeño pode permitir que a empresa execute esses serviços de forma mais barata e com maior throughput, fortalecendo sua posição competitiva contra outros provedores de IA.

Embora o Jalapeño permaneça na fase de teste, a OpenAI planeja implantá-lo em seus data centers assim que os benchmarks de desempenho forem finalizados. A roadmap da empresa sugere uma transição gradual longe das GPUs de terceiros em direção a uma pilha de hardware mais integrada verticalmente, refletindo tendências no setor de tecnologia mais amplo.

A participação da Broadcom marca uma expansão significativa de seu papel no mercado de hardware de IA. Ao se associar a uma empresa de IA de alto perfil, o fabricante de semicondutores se posiciona como um fornecedor-chave para cargas de trabalho de inferência de próxima geração, potencialmente abrindo novos fluxos de receita além de seus produtos tradicionais de networking e armazenamento.

No geral, o lançamento sinaliza o compromisso da OpenAI em moldar a pilha de IA como um todo, desde a pesquisa de modelos até o silício que os executa. Se o Jalapeño cumprir sua promessa, pode redefinir as estruturas de custo para os serviços de IA e estabelecer um novo padrão para aceleradores de IA personalizados.

Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.

OpenAI lança chip de inferência personalizado Jalapeño, desenvolvido com a Broadcom

Key Points

Também disponível em: