AMD enfrenta los benchmarks de NVIDIA Vera con un modelo por rack de 100 kW que pone el foco en densidad, consumo e infraestructura de IA

AMD publicó un análisis técnico centrado en los CPU EPYC para infraestructura de IA agentiva, pocos días después de que las primeras pruebas públicas de NVIDIA Vera (ejecutadas por Phoronix) mostraran un salto relevante frente a generaciones anteriores de ARM para servidores.
La diferencia principal no está solo en los números, sino en la forma de medirlos: Phoronix evaluó rendimiento de CPU en cargas concretas sobre Linux, mientras AMD llevó la discusión al nivel de rack, potencia disponible y capacidad desplegable en centros de datos.
El punto de partida es una diferencia metodológica importante, y que las pruebas ejecutadas por Phoronix midieron NVIDIA Vera sobre una plataforma de preproducción, con Ubuntu 24.04 LTS, un kernel Linux 6.18 LTS parcheado y GCC 16.1, pero sin datos de consumo del CPU ni monitoreo de frecuencia durante esa primera ronda de benchmarks.
Nota: Hay que tener en cuenta que en la publicación del benchmark de Phoronix, señala que NVIDIA no permitió la publicación de la data de consumo.
Por su parte, AMD, en su análisis, toma el rendimiento por rack como eje y compara NVIDIA Vera, Intel Xeon 6980P, AMD EPYC 9965 y una proyección de AMD EPYC “Venice” dentro de un límite común de 100kW.
Raghu Nambiar, VP corporativo de ecosistemas de centros de datos e ingeniería de aplicaciones en la unidad Server de AMD, afirmó que el texto donde la compañía explicita por qué prefiere medir el despliegue completo y no solo el resultado de un benchmark aislado.
“Los clientes no despliegan titulares de benchmarks; despliegan racks limitados por energía, refrigeración, espacio físico, compatibilidad de software y preparación operativa”.
Raghu Nambiar, VP corporativo de ecosistemas de centros de datos e ingeniería de aplicaciones en la unidad Server de AMD
El documento metodológico de AMD define la comparación sobre cuatro plataformas:
Todas las estimaciones se llevan a nodos 2P y a un rack con límite de 100 kW, por lo que la cantidad de nodos que cabe en ese presupuesto energético pasa a ser parte del resultado.
La fórmula usada por AMD es directa: el rendimiento por rack se obtiene al multiplicar la cantidad de nodos soportados dentro de 100 kW por el rendimiento estimado de cada nodo. Ese punto es clave, porque un procesador con mayor rendimiento por nodo no necesariamente conserva la misma ventaja cuando se considera la potencia total, la densidad y el número de sistemas instalables por rack.
AMD también detalla que la estimación de Vera en las seis cargas se deriva escalando el rendimiento de NVIDIA Grace con un factor de 1,63x. Ese factor proviene de la media geométrica publicada por Phoronix para Vera frente a Grace, lo que muestra que AMD usa el resultado externo como insumo, pero lo inserta dentro de un modelo de infraestructura distinto.
Las seis cargas elegidas buscan representar servicios que rodean a sistemas de IA agentiva en producción:
Nota: AMD aclara que TPROC-C es una carga derivada y no comparable con resultados oficiales TPC-C.
El resultado agregado favorece a AMD en sus propios ajustes, ya que la CPU EPYC 9965 aparece con 2,37 veces el rendimiento por rack de NVIDIA Vera, Intel Xeon 6980P queda en 1,46 veces y EPYC “Venice” sube a 3,30 veces, siempre con Vera como base 1,00 y dentro de las condiciones definidas por AMD.
La densidad por rack es el punto donde AMD intenta separar su lectura de una comparación de CPU individual. Bajo ese encuadre, la compañía traduce la cantidad de núcleos, la configuración 2P y el límite de 100 kW en capacidad concurrente por rack.
Más que una refutación directa a los resultados de Phoronix, la respuesta de AMD apunta a un aspecto distinto del problema.
En lugar de centrarse únicamente en el rendimiento del CPU en cargas específicas, la compañía lleva la comparación al nivel de infraestructura y considera factores como:
Phoronix mostró que NVIDIA Vera tuvo una entrada fuerte para un CPU ARM de servidor:
AMD, en cambio, sostiene que la pregunta relevante para IA agéntica no es solo qué tan rápido responde un procesador aislado. Su argumento es que los sistemas en producción dependen de servicios persistentes como bases de datos, cachés, APIs, web front ends y middleware, donde la concurrencia y la densidad por rack pueden ser más importantes que un resultado puntual por chip.
Phoronix midió NVIDIA Vera sobre hardware real, pero con cargas seleccionadas y sin datos de rendimiento por watt, mientras AMD entrega una comparación más cercana al diseño de infraestructura, aunque basada en datos publicados, mediciones internas y factores de proyección.
En términos prácticos, ambas visiones pueden coexistir; no obstante, NVIDIA Vera se muestra como una señal relevante para ARM en servidores de alto rendimiento, pero AMD responde que la compra real en centros de datos se decide por capacidad desplegable, consumo, densidad, continuidad de software y disponibilidad de plataformas completas.
La disputa, por tanto, no es solo entre NVIDIA Vera y AMD EPYC. Es una discusión sobre qué métrica debe importar más en la infraestructura para IA agentiva: el rendimiento de un CPU en pruebas específicas o el trabajo total que puede sostener un rack bajo límites de energía y operación.