AMD
Imagen de AMD

AMD EPYC 9754, el cerebro del supercomputador Leftraru Epu del CMM de la Universidad de Chile

Durante nuestra visita al Laboratorio Nacional de Supercomputación (NLHPC) en el Centro de Modelamiento Matemático (CMM) de la Universidad de Chile (cita que te contaremos más adelante), tuvimos la oportunidad de conocer a Leftraru Epu (del Mapudungún significa Lautaro 2), el nuevo supercomputador que representa un avance significativo para la investigación en el país. Este poderoso sistema, compuesto por servidores Lenovo ThinkSystem, tiene como cerebro al procesador AMD EPYC 9754. Un procesador de alto rendimiento que impulsa las capacidades avanzadas de cálculo, que lo catapultan como una herramienta esencial para el desarrollo científico y tecnológico en Chile.

  • AMD EPYC 9754 - Pisapapeles
  • AMD EPYC 9754 - Pisapapeles 2

Aunque la serie AMD EPYC 9004 fue anunciada a fines de 2022, el procesador que actualmente se usa en el CMM fue lanzado a mediados del 2023. Por lo mismo, es importante conocer algunas de sus características para entender por qué la solución AMD-Lenovo fue elegida como parte de Leftraru 2.

Es importante indicar que se utilizaron 29 nodos, los que se muestran con sus respectivas fotografías y son los siguientes:

  • 27 nodos Lenovo ThinkSystem SR645 V3. (foto 1)
  • 2 nodos Lenovo ThinkSystem SR675 V3, estos cuentan con 6 GPUs AMD Instinct MI 210 cada uno. (foto 2)

La generación de procesadores AMD EPYC Serie 9004 representa un salto cualitativo en la tecnología de servidores. Con capacidades mejoradas en rendimiento, eficiencia energética y seguridad, estos procesadores están diseñados para superar las expectativas más exigentes en los centros de datos modernos.

Especificaciones del AMD EPYC 9754 con nombre clave Bergamo

Los procesadores de la Serie 9004 ofrecen hasta 128 núcleos en arquitectura Zen 4 de 5 nm. Para el caso del EPYC 9754, este cuenta con 2 complejos de núcleos (CCX), los que a su vez, son alojados por 8 complejos donde residen los CCX, este complejo también es llamado CCD. Del mismo modo, el EPYC 9754 integra 256 MB de caché L3 (o 16MB por cada CCX), apoyados por 12 canales DDR5 que soportan hasta 12 TB de memoria RAM.

La compatibilidad con PCIe 5.0 proporciona un alto ancho de banda, crucial para las últimas tecnologías de tarjetas gráficas y almacenamiento. Estos avances aseguran un rendimiento óptimo en la nube, computación de alto rendimiento (HPC), gestión de centros de datos y cómputo para la Inteligencia Artificial.

La serie 9004 cuenta con una notable mejora en la eficiencia energética, ofreciendo un rendimiento hasta 2.7 veces superior en comparación con generaciones anteriores. La siguiente tabla resumen sus características técnicas.

La seguridad es un pilar fundamental en los servidores modernos. AMD ha implementado un robusto ecosistema de funciones de seguridad denominado AMD Infinity Guard. Este sistema incluye protecciones desde el nivel del chip con el procesador AMD Secure, hasta modernas funcionalidades para la seguridad de contenedores y sistemas de cifrado de memoria seguro.

Esta generación suma el cifrado AES-XTS de 256 bits y el cifrado multiclave seguro (SMKE), lo que permite a los hipervisores encriptar selectivamente rangos del espacio de direcciones en la memoria CXL adjunta, facilitando un entorno confidencial para la computación.

¿Qué características tiene la CPU AMD EPYC 9754, que la hace idónea para aplicaciones HPC?

En particular, el 9754 cuenta con 128 núcleos y 256 hilos que le permite generara una multitud de procesos multitarea con una gran eficiencia energética gracias a su arquitectura Zen 4 de 5 nanómetros, debido a la mayor densidad de transistores del chiplets.

Según destaca el sitio Tom's Hardware, la CPU ha mejorado un 14% el rendimiento por ciclo de reloj (IPC), comparado con su antecesor. De hecho, gracias a la arquitectura Zen 4, permite que la CPU realice más operaciones por ciclo, y por consecuencia mejora su eficiencia.

Por otra parte, la arquitectura de AMD está muy bien pensada, en el sentido de que permite que los procesadores se autorregulen según el trabajo que están haciendo. Es decir, con este ajuste dinámico en cuanto a consumo eléctrico, permite que la carga de trabajo se controle óptimamente en los centros de datos, ahorrando energía.

No olvidemos que los EPYC 9004 cuenta memorias DDR5 hasta 4.800 MT/s, cuya velocidad es mayor al DDR4 con 3.200 MT/s, y a su vez, también es mucho más eficiente, energéticamente hablando.

En el Especial de Tabulado sobre Data Center, todos los entrevistados concuerdan que el consumo o el rendimiento por vatio es clave para el segmento, de ahí que los EPYC sean un acierto para Leftraru 2.

En la computación de alto rendimiento (HPC), es esencial reducir la latencia y por su puesto aumentar el ancho de banda, de ahí que la presencia de PCIe 5.0 en los EPYC es fundamental, ya que esto permite una comunicación extremadamente rápida entre unidades de almacenamiento, GPU y otros dispositivos presentes en la placa.

¿Cómo crees que impactará el uso de las CPU de AMD en el nuevo supercomputador de la Universidad de Chile?

FUENTE 1 | FUENTE 2