OpenAI y Broadcom dieron a conocer Jalapeño, el primer Intelligence Processor que OpenAI diseñó para ejecutar inferencia en LLM a gran escala. OpenAI desarrolló el chip para cargas asociadas a ChatGPT, Codex, la API de OpenAI y futuros productos con agentes de IA, aunque ambas compañías todavía no publican una ficha completa de silicio.
Jalapeño está diseñado para inferencia de LLM, no como GPU generalista
El procesador creado desde cero para inferencia, la etapa en que un modelo procesa una solicitud y genera una respuesta. OpenAI indica que la arquitectura considera kernels, movimiento de memoria, red y patrones de servicio, con el objetivo de acercar la utilización real del sistema al rendimiento teórico del hardware.
A diferencia de una GPU generalista, Jalapeño apunta a una carga más acotada. Reuters reportó que el chip debe responder consultas de productos como ChatGPT, y que tanto los chips como los sistemas asociados estarán disponibles solo para OpenAI.

Especificaciones confirmadas de Jalapeño
Por ahora, Jalapeño no se puede comparar de manera técnica con aceleradores de NVIDIA, AMD o Google. OpenAI y Broadcom no publicaron datos clave como memoria HBM, ancho de banda, consumo, transistores, FLOPS/TOPS o tipo de empaquetado, que son necesarios para una comparación verificable.
TSMC fabricará el chip y Celestica integrará los sistemas
Reuters reporta que el diseño fue enviado a TSMC para fabricación, mientras que Celestica construirá los sistemas de servidor asociados. Esa información ubica a Jalapeño como una pieza de infraestructura para centros de datos de OpenAI, no como un producto comercial para fabricantes de PC, estaciones de trabajo o servidores convencionales.
Hock Tan comparó Jalapeño con NVIDIA Blackwell y las TPU de Google en declaraciones a Reuters, aunque no entregó resultados de benchmark público. En el comunicado oficial, el presidente y CEO de Broadcom describió la alianza con OpenAI como una hoja de ruta multigeneracional para centros de datos a escala de gigavatios desde 2026.
«Nuestra colaboración con OpenAI representa un compromiso fundamental […] para la próxima década de la IA. Al codesarrollar nuestro silicio directamente con OpenAI, estamos permitiendo el despliegue de centros de datos a escala de gigavatios con Microsoft y otros socios a partir de 2026».
Hock Tan, CEO de Broadcom
OpenAI declara más rendimiento por watt en Jalapeño
OpenAI no publicó una cifra final de rendimiento para Jalapeño, pero informó que las muestras de ingeniería ya operan en laboratorio a la frecuencia y potencia previstas para producción. Según la compañía, las primeras pruebas muestran una mejora sustancial de rendimiento por watt frente al estado del arte actual.
La arquitectura combina cómputo, memoria y red para reducir el movimiento de datos durante la inferencia de LLM. En este tipo de carga, la latencia, la utilización del hardware y el costo energético por respuesta dependen de cómo se coordinan esos recursos a escala en data centers.

