Arquitetura do Ironwood TPU da Google

A Google revelou sua mais recente Unidade de Processamento de Tensor, nomeada Ironwood, como a primeira TPU construída principalmente para cargas de trabalho de inferência em massa em vez de treinamento. O chip integra dois dies de computação, cada um entregando 4.614 TFLOPs de desempenho FP8. Oito pilhas de memória HBM3e fornecem 192 GB por chip, entregando 7,3 TB/s de largura de banda. O design de dois dies permite que o sistema seja dimensionado sem lógica de cola, suportando até 9.216 chips por pod.

Memória Compartilhada Recorde

Quando totalmente montado, o pod Ironwood oferece 1,77 PB de memória HBM diretamente endereçável, estabelecendo um novo recorde mundial para supercomputadores de memória compartilhada. O grande pool de memória é vinculado por switches de circuito óptico que conectam as prateleiras, permitindo que o sistema mantenha alta largura de banda enquanto é dimensionado.

Desempenho e Eficiência

Ao longo do pod completo, a configuração atinge 42,5 exaflops de desempenho. A Google afirma uma melhoria de duas vezes no desempenho por watt em comparação com sua geração anterior, Trillium, graças à escala de tensão-frequência dinâmica e a uma solução de refrigeração líquida com placa fria que aproveita a infraestrutura de refrigeração de terceira geração da empresa.

Confiabilidade, Disponibilidade e Manutenção (RAS)

O Ironwood incorpora várias funcionalidades de confiabilidade no chip, incluindo uma raiz de confiança, funções de auto-teste e mecanismos para mitigar a corrupção silenciosa de dados. Funções de reparo de lógica melhoram o rendimento de fabricação, e o sistema pode ser reconfigurado em torno de nós com falha, restaurando cargas de trabalho de pontos de verificação.

Design Assistido por IA e SparseCore

A Google utilizou técnicas de IA para otimizar os circuitos ALU e o plano de layout do chip Ironwood. Um SparseCore de quarta geração é adicionado para acelerar embeddings e operações coletivas, visando cargas de trabalho como motores de recomendação.

Implantação e Disponibilidade

A Google começou a implantar o Ironwood em seus data centers de nuvem em larga escala, embora a TPU permaneça como uma plataforma interna não oferecida diretamente a clientes externos. O design reflete a estratégia de longo prazo da Google para construir computação de alto nível de IA em camadas de chip, interconexão e infraestrutura física.

Este artigo foi escrito com a assistência de IA.
News Factory SEO ajuda você a automatizar conteúdo de notícias para o seu site.