OpenAI, el creador de ChatGPT y otras herramientas de modelo de lenguaje grande, y Broadcom, un veterano proveedor de silicio, revelaron un chip con propósito específico llamado Jalapeño el miércoles. El anuncio posiciona el chip como la primera generación de un esfuerzo de varios años para entregar hardware ajustado específicamente para cargas de trabajo de inferencia de LLM en centros de datos a gran escala.

Jalapeño se dirige a las demandas intensivas de cálculo de los modelos de lenguaje modernos, que actualmente dependen de sistemas de inferencia de propósito general. Al centrarse en las características únicas de las cargas de trabajo de LLM, el chip pretende reducir el consumo de energía mientras mantiene o mejora el rendimiento.

Broadcom describió el ASIC como el producto de "conocimientos detallados" recopilados durante conversaciones extensas con los equipos de investigación de OpenAI. Esas discusiones informaron la arquitectura del chip, alineándola con la hoja de ruta de OpenAI para futuros modelos y productos. La colaboración refleja un nivel rareza de codiseño entre un laboratorio de inteligencia artificial líder y un fabricante de hardware.

Desde el concepto hasta el silicio, el proyecto abarcó nueve meses. Dentro de ese período, Broadcom diseñó el chip desde cero, integrando comentarios de OpenAI en cada etapa. Ambas empresas enfatizan que el ciclo de desarrollo rápido demuestra lo cerca que trabajaron juntos los socios.

Según las empresas, la especialización de Jalapeño lo distingue de los procesadores que actualmente alimentan la inferencia de LLM. El hardware de centro de datos existente a menudo equilibra una amplia gama de tareas de inteligencia artificial, mientras que Jalapeño se centra en los patrones de inferencia típicos de los modelos de lenguaje grande. Ese enfoque, dicen, se traduce en una mayor eficiencia.

Las pruebas iniciales de OpenAI indican que el chip ofrece un "rendimiento por vatio sustancialmente mejor que las soluciones actuales del estado del arte". Si bien las cifras exactas siguen siendo secretas, la declaración sugiere un salto significativo en la eficiencia energética, una métrica crítica para los operadores que ejecutan cargas de trabajo de inteligencia artificial costosas y consumidoras de energía.

Las empresas advirtieron que las mediciones de rendimiento formales aún están en progreso. Un informe técnico integral, prometieron, se lanzará en los próximos meses para detallar los resultados de los benchmarks y las opciones arquitectónicas.

Ambos socios ven a Jalapeño como el punto de partida de un viaje más largo. Visualizan refinamientos iterativos que mantendrán el ritmo de la rápida evolución de las arquitecturas de LLM. Se espera que las generaciones futuras del chip incorporen lecciones aprendidas de implementaciones del mundo real y de los diseños de modelos de próxima generación de OpenAI.

Los observadores de la industria señalan que un chip de inferencia de LLM dedicado podría cambiar la economía de la implementación de la inteligencia artificial, especialmente a medida que las empresas escalan los servicios de modelo de lenguaje. Si Jalapeño cumple con sus promesas iniciales, los operadores de centros de datos pueden ver costos operativos más bajos y una huella de carbono más pequeña, mientras que los desarrolladores de inteligencia artificial obtienen acceso a hardware que se ajusta a las demandas de modelos cada vez más grandes.

Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory APP - agentische News für besseres SEO & AEO.