AMD responde a NVIDIA Vera y lleva la comparación de EPYC al rendimiento por rack

AMD enfrenta los benchmarks de NVIDIA Vera con un modelo por rack de 100 kW que pone el foco en densidad, consumo e infraestructura de IA

AMD publicó un análisis técnico centrado en los CPU EPYC para infraestructura de IA agentiva, pocos días después de que las primeras pruebas públicas de NVIDIA Vera (ejecutadas por Phoronix) mostraran un salto relevante frente a generaciones anteriores de ARM para servidores.

La diferencia principal no está solo en los números, sino en la forma de medirlos: Phoronix evaluó rendimiento de CPU en cargas concretas sobre Linux, mientras AMD llevó la discusión al nivel de rack, potencia disponible y capacidad desplegable en centros de datos.

AMD cambia la pregunta desde el CPU individual hacia el rack completo

El punto de partida es una diferencia metodológica importante, y que las pruebas ejecutadas por Phoronix midieron NVIDIA Vera sobre una plataforma de preproducción, con Ubuntu 24.04 LTS, un kernel Linux 6.18 LTS parcheado y GCC 16.1, pero sin datos de consumo del CPU ni monitoreo de frecuencia durante esa primera ronda de benchmarks.

Nota: Hay que tener en cuenta que en la publicación del benchmark de Phoronix, señala que NVIDIA no permitió la publicación de la data de consumo.

Por su parte, AMD, en su análisis, toma el rendimiento por rack como eje y compara NVIDIA Vera, Intel Xeon 6980P, AMD EPYC 9965 y una proyección de AMD EPYC “Venice” dentro de un límite común de 100kW.

Raghu Nambiar, VP corporativo de ecosistemas de centros de datos e ingeniería de aplicaciones en la unidad Server de AMD, afirmó que el texto donde la compañía explicita por qué prefiere medir el despliegue completo y no solo el resultado de un benchmark aislado.

“Los clientes no despliegan titulares de benchmarks; despliegan racks limitados por energía, refrigeración, espacio físico, compatibilidad de software y preparación operativa”.
Raghu Nambiar, VP corporativo de ecosistemas de centros de datos e ingeniería de aplicaciones en la unidad Server de AMD

AMD compara el rendimiento por rack con NVIDIA Vera como base 1,00, bajo un escenario modelado de 100 kW para plataformas dual socket. | Créditos: AMD

La metodología de AMD no parte solo del rendimiento del procesador, sino de cuántos nodos puede sostener un rack de 100 kW según potencia, densidad y configuración dual socket. | Créditos: AMD

El modelo de AMD usa seis cargas y un límite común de 100 kW

El documento metodológico de AMD define la comparación sobre cuatro plataformas:

NVIDIA Vera de 88 núcleos.
Intel Xeon 6980P de 128 núcleos
AMD EPYC 9965 de 192 núcleos
AMD EPYC “Venice” de 256 núcleos.

Todas las estimaciones se llevan a nodos 2P y a un rack con límite de 100 kW, por lo que la cantidad de nodos que cabe en ese presupuesto energético pasa a ser parte del resultado.

La fórmula usada por AMD es directa: el rendimiento por rack se obtiene al multiplicar la cantidad de nodos soportados dentro de 100 kW por el rendimiento estimado de cada nodo. Ese punto es clave, porque un procesador con mayor rendimiento por nodo no necesariamente conserva la misma ventaja cuando se considera la potencia total, la densidad y el número de sistemas instalables por rack.

El factor 1,63x que conecta Phoronix con el modelo de AMD

AMD también detalla que la estimación de Vera en las seis cargas se deriva escalando el rendimiento de NVIDIA Grace con un factor de 1,63x. Ese factor proviene de la media geométrica publicada por Phoronix para Vera frente a Grace, lo que muestra que AMD usa el resultado externo como insumo, pero lo inserta dentro de un modelo de infraestructura distinto.

Media geométrica de los resultados publicados por Phoronix para NVIDIA Vera, donde el CPU de NVIDIA queda por delante de las plataformas EPYC y Xeon incluidas en esa ronda inicial de pruebas. | Créditos: Phoronix | Vía: AMD

Las seis cargas elegidas buscan representar servicios que rodean a sistemas de IA agentiva en producción:

SPECrate 2017 Integer (cómputo general)
Server-side Java multi-JVM (Java del lado servidor)
NGINX + WRK (web serving)
Redis (base de datos en memoria y caché distribuida)
Memcached (sistema de caché distribuida en memoria)
TPROC-C (bases de datos relacionales).

Nota: AMD aclara que TPROC-C es una carga derivada y no comparable con resultados oficiales TPC-C.

El resultado agregado favorece a AMD en sus propios ajustes, ya que la CPU EPYC 9965 aparece con 2,37 veces el rendimiento por rack de NVIDIA Vera, Intel Xeon 6980P queda en 1,46 veces y EPYC “Venice” sube a 3,30 veces, siempre con Vera como base 1,00 y dentro de las condiciones definidas por AMD.

La densidad por rack es el punto donde AMD intenta separar su lectura de una comparación de CPU individual. Bajo ese encuadre, la compañía traduce la cantidad de núcleos, la configuración 2P y el límite de 100 kW en capacidad concurrente por rack.

Comparación de densidad por rack usada por AMD para mostrar núcleos o sandboxes disponibles en configuraciones 2P frente a NVIDIA Vera. | Créditos: NVIDIA

¿Por qué esto no anula las pruebas de Phoronix?

Más que una refutación directa a los resultados de Phoronix, la respuesta de AMD apunta a un aspecto distinto del problema.

En lugar de centrarse únicamente en el rendimiento del CPU en cargas específicas, la compañía lleva la comparación al nivel de infraestructura y considera factores como:

Densidad de núcleos por sistema.
Consumo estimado de plataformas dual socket.
Cantidad de nodos que pueden instalarse dentro de un rack de 100 kW.
Rendimiento agregado por rack en distintas cargas de trabajo.
Restricciones operativas asociadas a energía, refrigeración y espacio físico.

Phoronix midió rendimiento bruto de CPU en pruebas seleccionadas

Phoronix mostró que NVIDIA Vera tuvo una entrada fuerte para un CPU ARM de servidor:

NVIDIA Vera superó en 10% al AMD EPYC 9575F de 5,0 GHz en media geométrica
Alcanzó 1,63 veces el rendimiento de Grace, aunque con la advertencia de que el consumo y la frecuencia quedaron fuera de esa primera evaluación.

AMD, en cambio, sostiene que la pregunta relevante para IA agéntica no es solo qué tan rápido responde un procesador aislado. Su argumento es que los sistemas en producción dependen de servicios persistentes como bases de datos, cachés, APIs, web front ends y middleware, donde la concurrencia y la densidad por rack pueden ser más importantes que un resultado puntual por chip.

Phoronix midió NVIDIA Vera sobre hardware real, pero con cargas seleccionadas y sin datos de rendimiento por watt, mientras AMD entrega una comparación más cercana al diseño de infraestructura, aunque basada en datos publicados, mediciones internas y factores de proyección.

La comparación cambia cuando el límite es el rack completo

En términos prácticos, ambas visiones pueden coexistir; no obstante, NVIDIA Vera se muestra como una señal relevante para ARM en servidores de alto rendimiento, pero AMD responde que la compra real en centros de datos se decide por capacidad desplegable, consumo, densidad, continuidad de software y disponibilidad de plataformas completas.

La disputa, por tanto, no es solo entre NVIDIA Vera y AMD EPYC. Es una discusión sobre qué métrica debe importar más en la infraestructura para IA agentiva: el rendimiento de un CPU en pruebas específicas o el trabajo total que puede sostener un rack bajo límites de energía y operación.

Ivan

Editor especializado en ciencia y tecnología, con foco en innovación, inteligencia artificial, telecomunicaciones y centros de datos. Trabajo con un enfoque riguroso y técnico, desarrollando contenidos sobre semiconductores, energía, ciberseguridad e infraestructura tecnológica.

Los comentarios de Disqus están cargando....

Publicado por