OpenAI y Broadcom presentan Jalapeño, un ASIC de inferencia para LLM

OpenAI y Broadcom dieron a conocer Jalapeño, el primer Intelligence Processor que OpenAI diseñó para ejecutar inferencia en LLM a gran escala. OpenAI desarrolló el chip para cargas asociadas a ChatGPT, Codex, la API de OpenAI y futuros productos con agentes de IA, aunque ambas compañías todavía no publican una ficha completa de silicio.

La Revolución de la IA: Modelos de Lenguaje de Gran Tamaño (LLM) explicados

Jalapeño está diseñado para inferencia de LLM, no como GPU generalista

El procesador creado desde cero para inferencia, la etapa en que un modelo procesa una solicitud y genera una respuesta. OpenAI indica que la arquitectura considera kernels, movimiento de memoria, red y patrones de servicio, con el objetivo de acercar la utilización real del sistema al rendimiento teórico del hardware.

A diferencia de una GPU generalista, Jalapeño apunta a una carga más acotada. Reuters reportó que el chip debe responder consultas de productos como ChatGPT, y que tanto los chips como los sistemas asociados estarán disponibles solo para OpenAI.

Especificaciones confirmadas de Jalapeño

Por ahora, Jalapeño no se puede comparar de manera técnica con aceleradores de NVIDIA, AMD o Google. OpenAI y Broadcom no publicaron datos clave como memoria HBM, ancho de banda, consumo, transistores, FLOPS/TOPS o tipo de empaquetado, que son necesarios para una comparación verificable.

TSMC fabricará el chip y Celestica integrará los sistemas

Reuters reporta que el diseño fue enviado a TSMC para fabricación, mientras que Celestica construirá los sistemas de servidor asociados. Esa información ubica a Jalapeño como una pieza de infraestructura para centros de datos de OpenAI, no como un producto comercial para fabricantes de PC, estaciones de trabajo o servidores convencionales.

Hock Tan comparó Jalapeño con NVIDIA Blackwell y las TPU de Google en declaraciones a Reuters, aunque no entregó resultados de benchmark público. En el comunicado oficial, el presidente y CEO de Broadcom describió la alianza con OpenAI como una hoja de ruta multigeneracional para centros de datos a escala de gigavatios desde 2026.

«Nuestra colaboración con OpenAI representa un compromiso fundamental […] para la próxima década de la IA. Al codesarrollar nuestro silicio directamente con OpenAI, estamos permitiendo el despliegue de centros de datos a escala de gigavatios con Microsoft y otros socios a partir de 2026».
Hock Tan, CEO de Broadcom

OpenAI declara más rendimiento por watt en Jalapeño

OpenAI no publicó una cifra final de rendimiento para Jalapeño, pero informó que las muestras de ingeniería ya operan en laboratorio a la frecuencia y potencia previstas para producción. Según la compañía, las primeras pruebas muestran una mejora sustancial de rendimiento por watt frente al estado del arte actual.

La arquitectura combina cómputo, memoria y red para reducir el movimiento de datos durante la inferencia de LLM. En este tipo de carga, la latencia, la utilización del hardware y el costo energético por respuesta dependen de cómo se coordinan esos recursos a escala en data centers.