Conocimos el NLHPC, hogar de los supercomputadores Guacolda y Leftraru Epu, con una capacidad conjunta de casi 480 TFlops.
Recientemente, tuvimos la oportunidad de visitar el Laboratorio Nacional de Computación de Alto Rendimiento (NLHPC), hogar del nuevo supercomputador Leftraru 2 (Leftraru Epu), una estructura clave para el desarrollo de la ciencia y la tecnología en el país. El laboratorio está ubicado en el edificio del Centro de Modelamiento Matemático (CMM) de la Universidad de Chile, en Beauchef 851, frente a la emblemática Facultad de Ciencias Físicas y Matemáticas (FCFM) de la misma universidad.
La oportunidad de conocer las instalaciones del NLHPC fue gracias a Juan Moscoso Gerente de Data Centers y Cloud de AMD para la región. En dicha instancia pudimos conversar con el vocero de AMD y con Gines Guerrero, quien es el Director del Centro. Si quieres conocer el detalle de la conversación puedes revisarla en Tabulado.net.
El nombre del laboratorio proviene del acrónimo HPC (High Performance Computing, que en español se traduce como Computación de Alto Rendimiento). Su objetivo es procesar grandes volúmenes de datos y realizar cálculos masivos en tiempos muy reducidos. El equipamiento es ideal para realizar simulaciones de procesos naturales y otras modelaciones que requieren manejar una gran cantidad de datos y variables complejas, las cuales un ordenador convencional tardaría muchísimo tiempo en resolver.
El NLHPC es la principal plataforma de supercomputación para la ciencia en Chile, la cual está destinada a potenciar la capacidad de los científicos e investigadores en el país. Para poder acceder a sus recursos, los profesionales deben postular con sus proyectos y recursos según los cálculos que necesitan. A su vez estos son estudiados caso a caso antes de ser asignados al supercomputador.
El NLHPC fomenta la colaboración entre investigadores y contribuye al desarrollo tecnológico a nivel nacional e internacional.
Gines Guerrero, director del NLHPC
El laboratorio está conformado por Universidades, organismos del Estado y por privados. Entre las instituciones académicas que la conforman están:
El centro nacional de computación de alto rendimiento ofrece una potente infraestructura de cálculo avanzado para instituciones académicas, científicas y del sector productivo del país. El uso del equipo permite el modelamiento de procesos físicos y análisis de grandes volúmenes de datos. Algunas de las áreas de estudio son el cambio climático, la física de materiales, la biotecnología y la inteligencia artificial.
Para lo anterior, la institución cuenta con dos clústeres, el primero de ellos fue creado en 2019 y llamado Guacolda. Mientras que el segundo bautizado como Leftraru Epu (o Lautaro 2, traducido del Mapudungún), fue inaugurado en junio de este año. El conjunto está potenciando con equipamiento de almacenamiento de IBM de cuatro petabytes, el IBM Elastic Storage System (IBM ESS 3200).
En la entrevista con Tabulado, Gines Guerrero señaló que el proyecto del NLHPC ya cuenta con 15 años de existencia. El primer supercomputador fue Leftraru 1 en 2009/2010, que se creó con aportes de diversos fondos:
En ese proyecto (de 2009) postularon ocho instituciones donde la Universidad de Chile quedó como líder de esta nueva área de supercomputación. Desde entonces nuestro principal objetivo siempre ha sido ofrecer recursos a toda la comunidad científica nacional para poder tener un progreso en la ciencia y generar un impacto en el Estado y en la industria del país.
Gines Guerrero, director del Centro Nacional de Supercomputación
Leftraru 1, vio la luz en 2014 cuyo rack tenía componentes HP con una capacidad total instalada de 50 Teraflops. Posteriormente fue actualizado y llegó a tener 70 Teraflos hasta que fue jubilado por su reemplazo, el Leftraru Epu en junio de este año.
En la misma charla, Guerrero señaló que Leftraru 1 no era capaz de satisfacer la demanda, por lo que el trabajo fue reforzado y se desarrolló una nueva propuesta que, en 2019, dio lugar a Guacolda, el segundo supercomputador del NLHPC. Con este avance, se pasó de contar con 8 instituciones científicas a 44, distribuidas entre universidades y centros de investigación de diversa índole.
…[] nuestro trabajo los 10 últimos años, donde el apoyo de las 8 instituciones iniciales, nos permitieron generar fuertes lazos de confianza con la comunidad, y hoy tenemos 44 instituciones que son parte de esta iniciativa académica y eso nos llena de orgullo.
Guacolda, el supercomputador que vio la luz gracias al apoyo de las 44 instituciones. En potencia de cálculo de ese tiempo, superaba 5 veces la capacidad de Leftraru 1, o en términos de notebooks de la época: «…[] Posee la capacidad de procesamiento equivalente a 25.000 notebooks de alta gama».
En ese momento, destacamos que el proyecto liderado por la Universidad de Chile incluía a 39 universidades, 4 centros de investigación y la Agencia Nacional de Investigación y Desarrollo. Además, 30 de estas instituciones ya participaban en proyectos, con 150 de ellos desarrollándose de manera simultánea.
Además, Guacolda se destacó internacionalmente en 2021 al posicionarse en el top 40 del ranking IO500. Este escalafón evalúa el rendimiento de los sistemas de almacenamiento de alto rendimiento en supercomputadoras, midiendo la efectividad de sus procesos de entrada y salida (I/O). La clasificación se basa en pruebas que combinan el ancho de banda y el rendimiento de los metadatos, lo que permite una evaluación precisa del sistema en contextos reales de alto volumen de datos.
Durante la plática con Tabulado, Ginés relató que las 44 instituciones firmaron un acuerdo hace tres años, en la que reconocía la labor y aporte del laboratorio al desarrollo de las ciencias en el país, esto facilitó la posibilidad de acceder a nuevos recursos con apoyo del gobierno de Chile, lo que permitiría la actualización del nuevo rack de supercómputo.
Esta actualización no solo trajo avances técnicos significativos, sino que también posicionó a Leftraru 2 como uno de los sistemas de HPC más potentes del país y de toda Latinoamérica. En una entrevista con el diario El Mercurio, el director del Centro destacó que Leftraru 2 tiene cuatro veces la potencia de cálculo que Guacolda. Además, detalló que el valor total de la licitación fue de 1.150 millones de pesos, distribuidos de la siguiente manera:
En la misma publicación, el vocero de AMD, Juan Moscoso, también destacó la potencia de cálculo del equipo, y a su vez, que el nuevo hardware es más eficiente desde el punto de vista energético:
“Estamos entregando cuatro veces más cómputo que la supercomputadora anterior (Guacolda), y a la vez estamos siendo dos veces más eficientes energéticamente”.
Juan Moscoso de AMD, en cita al Mercurio.
Sobre lo mismo, el directo del NLHCP, acotó en otra entrevista, dirigida por el departamento de prensa del CMM, qué el laboratorio también debe sumarse a las condicionantes medio ambientales actuales:
“Es imperativo que sigamos potenciando el NLHPC para no quedarnos atrás y poder enfrentar los desafíos científicos y tecnológicos del futuro. El camino es largo y necesitamos un compromiso continuo de todos los sectores para alcanzar nuestras metas. La infraestructura de supercómputo es un requerimiento esencial para el desarrollo de cualquier país”
Gines Guerrero, en cita al CMM, U. de Chile
Durante nuestra visita, Juan Moscoso y Ginés Guerrero comentaron sobre el proceso de licitación del nuevo hardware del supercomputador. Ambos coincidieron en que todas las propuestas presentadas incluían hardware de AMD, al menos en lo que respecta a las CPU, específicamente con los modelos AMD EPYC Serie 9004. Entre las empresas que participaron en el concurso, Emtec destacó con una propuesta que incluía un rack con servidores Lenovo y componentes tanto de CPU como de GPU de AMD.
El portavoz del NLHPC subrayó que el Centro está disponible no solo para las 44 instituciones afiliadas, sino también para cualquier científico independiente que desee presentar un proyecto. Dicho proyecto será evaluado por el comité correspondiente, y si cumple con los requisitos necesarios, se permitirá el uso de la infraestructura de cómputo que proporciona Guacolda y Leftraru Epu.
Hasta la fecha de nuestra visita, más de 500 usuarios registrados han utilizado la infraestructura, todos ellos han realizado diversas simulaciones. En lo que va del año, el centro ha apoyado más de 200 publicaciones científicas, incluidas tesis de pregrado y postgrado, declaró Ginés Guerrero.
La historia del NLHPC comenzó entre 2009 y 2010, cuando se presentó una propuesta a la Comisión Nacional de Investigación Científica y Tecnológica (CONICYT). En 2014 se inauguró el primer supercomputador del centro, Leftraru 1 (Lautaro 1), nombrado en honor al líder mapuche de la Guerra del Arauco durante la colonia española.
Ante los crecientes requerimientos de modelación por parte de los científicos chilenos, se instaló un nuevo supercomputador llamado Guacolda, en honor a la esposa de Lautaro. Así, el clúster del NLHPC pasó a llamarse Guacolda-Leftraru, y en 2020 se convirtió en el tercer sistema de cómputo más poderoso de América Latina, según informó BioBio.
Con el crecimiento exponencial de la inteligencia artificial y las exigencias medioambientales sobre consumo energético, sumado al incremento en el uso de estas tecnologías por parte de los científicos, se hizo necesaria otra actualización. Leftraru 1 (Kiñe) fue reemplazado por Leftraru 2 (Epu), un nuevo supercomputador cuya capacidad de cálculo casi cuadruplica a la de su antecesor. Su consumo energético es mucho más eficiente, basado en tecnología de AMD, así lo relató para Tabulado, Juan Moscoso:
… [] En AMD hemos adoptado una serie de acciones clave para operar y apoyar a este sector en toda la región. Una de ellas es dar prioridad a las fuentes de energía renovables, lo que nos permite reducir nuestro impacto medioambiental. Además, buscamos constantemente optimizar el consumo de energía en nuestros centros de datos, aplicando medidas para hacerlos más eficaces.
Juan Moscoso, gerente de Data Centers y Cloud de AMD
Fue un supercomputador fabricado por HP, cuyo rack tenía 128 nodos de servidores HP SL230 y 4 nodos de servidores HP SL250, ambos contaban con CPUs Intel Xeon E5-2660v2, lo que generaba un total de 2640 núcleos para cálculos pudiendo lograr rendimiento teórico de 70 TFlops.
Además, consideraba una capacidad de almacenamiento de 274TB, con un sistema de archivos paralelo y escalable, ideal para trabajos de HPC y bigdata, llamado DDN Exaescaler. Contó con 6.25TB de memoria RAM .
Guacolda, es la segunda supercomputadora anunciada en 2019 y presentada al público en enero de 2020 por el NLHPC. Su hardware es un sistema de alto rendimiento diseñado para apoyar a la ciencia en el país.
Cuando fue anunciada, su característica de hardware y arquitectura estaba basada en equipos Dell PowerEdge. Posicionando al Clúster Guacolda-Leftraru 1, como el tercer supercomputador más potente, ofreciendo un rendimiento teórico total de 219 TFlops.
Este dispositivo de alta tecnología cuenta con cuatro tipos diferentes de dispositivos de Dell (hoy Dell EMC):
Todos los nodos tienen CPUs Intel Xeon Gold 6152 en cada uno, son los encargados de mover deasde las simulaciones científicas hasta la resolución de problemas complejos en campos como la meteorología, fármacos, entre otros.
El clúster Guacolda está compuesto por un total de 2.596 núcleos para cómputo, 16.235 GB de RAM, distribuidos entre los diferentes tipos de nodos del rack.
El servidor R740 incluye una GPU NVIDIA Tesla V100 que entrega un total de 20.480 núcleos Tensor y, por último, el R7525 incluye dos 2 GPU AMD Instinct MI100, que suman 15.360 procesadores streams, solo el R7525 aporta 23 TFlops para cálculos.
A diferencia de Leftraru 1, Guacolda incorpora una GPU que permite el cómputo paralelo de grandes cantidades de datos, y que el Súper PC de 2014 no puede hacerlo. Como bien sabemos, esto es esencial para operaciones con GenAI, Big data y simulaciones de procesos físicos, por la gran cantidad de variables.
Hoy en día el NLHPC cuenta con los clústeres Guacolda y Leftraru Epu, los cuales están interconectados y comparten almacenamiento y conectividad. La entrada en funcionamiento de Leftraru 2 en junio ha aumentado significativamente la capacidad de cómputo del laboratorio, permitiendo su continuidad operativa y expansión de recursos para la ciencia en el país.
El supercomputador Guacolda-Leftraru Epu, físicamente son dos racks de servidores que conforman una infraestructura de computación de alto rendimiento que emplea una arquitectura de memoria distribuida (DSM), es decir, la configuración del hardware permite que cada clúster tenga acceso a un banco de memoria compartida que se suma a la memoria privada y propia de cada nodo (servidor) del rack.
La propuesta de trabajo del centro liderado por Gines Guerrero, integra tres aspectos claves para ser una infraestructura tipo High Performance Computing (HPC):
La combinación de estos tres elementos permite que se pueden hacer múltiples tareas en paralelo, ideal para proyectos de gran envergadura.
El IBM ESS3200 es un sistema elástico de almacenamiento ideado para centros de datos y que gestionan grandes volúmenes de información, gracias a su arquitectura basada en unidades SSD NVMe. Esto permite que empresas y centros de investigación puedan almacenar, procesar y analizar la data a una altísima velocidad. Convirtiéndose en una excelente opción para aplicaciones como la inteligencia artificial (IA), Data Science y HPC.
El ESS 3200 es un sistema escalable que ofrece una velocidad de hasta 80 GB/s por nodo, con una capacidad de almacenamiento que varía entre 48 Terabytes (TB) y 369 TB y un rendimiento de hasta 1.5 millones de IOPS (operaciones de entrada y salida por segundo). Gracias a su arquitectura flexible, es capaz de interconectar hasta 1.000 nodos, proporcionando una solución de alto rendimiento para gestionar grandes volúmenes de datos. La capacidad total instalada para la supercomputadora Guacolda-Leftraru 2, es de 4 Petabytes (PB).
El sistema también incluye capacidades avanzadas de protección y seguridad de los datos, integrando tecnologías como la replicación y la codificación de borrado, lo que garantiza la integridad de la información.
El InfiniBand NDR (Next Data Rate) es una tecnología (bus) de interconexión creada por NVIDIA Mellanox que ofrece una tasa de transferencia de datos muy veloces de hasta 400 Gbps de ancho de banda, ideal para trabajos de alto rendimiento, y es una excelente solución para:
Esta tecnología fue anunciada a finales de 2020, cuya capacidad duplicaba a la anterior generación y permite trabajos con ultrabaja latencia. Esta tecnología fue incorporada por las soluciones empresariales de muchos de los mayores fabricantes de servidores. Entre ellos: Dell Technologies, Fujitsu, GIGABYTE, Inspur, Lenovo y Supermicro (según comentó indicó NVIDIA).
El supercomputador Leftraru Epu – Clúster Lenovo (2024) es una infraestructura diseñada para computación de alto rendimiento. Cuenta con 27 nodos Lenovo ThinkSystem SR645 V3 y 2 nodos Lenovo ThinkSystem SR675 V3. Ambos equipos están potenciados por CPUs AMD EPYC 9754 (con nombre clave Bergamo).
El Lenovo ThinkSystem SR645 V3 es un servidor en bastidor de 1U diseñado para ofrecer un alto rendimiento y flexibilidad. Los nodos que están destinados al rack de Leftraru Epu están equipados con dos procesadores AMD EPYC 9754 de cuarta generación.
El servidor puede soportar hasta 6 TB de memoria DDR5 con 24 ranuras, y permite una amplia capacidad de almacenamiento con bahías para unidades de 3,5″, 2,5″ o EDSFF.
El SR645 V3 ofrece opciones de expansión con ranuras PCIe 4.0 y 5.0, y es compatible con hasta 4 GPUs de ancho simple, lo que lo hace ideal para cargas de trabajo exigentes en entornos de computación de alto rendimiento. Su administración está facilitada por el Lenovo XClarity Controller, y admite una amplia gama de sistemas operativos, incluyendo Windows Server, SUSE Linux, Red Hat Enterprise Linux y VMware ESXi.
Por su parte, los 2 nodos Lenovo ThinkSystem SR675 V3 son servidores en bastidor de 3U (ubicados en la parte inferior del rack). Cada uno soporta hasta 2 procesadores AMD EPYC por nodo y permite hasta 3 TB de memoria DDR5, distribuidos en 24 ranuras DIMM con una frecuencia máxima de 4800 MHz.
Su diseño modular ofrece flexibilidad, ya que en su configuración básica puede soportar hasta 4 GPU FHFL de doble ancho y 16 ranuras PCIe de quinta generación. Con opciones avanzadas que incluyen hasta 8 GPU AMD Instinct MI210 por nodo. Para el caso de Leftraru Epu, este cuenta con un total de 12 GPUs AMD Instinct MI210 (6 GPUs por cada nodo).
El SR675 V3 ofrece diversas opciones de almacenamiento, como unidades SSD NVMe y EDSFF E1.S y E3.S, optimizando el rendimiento en aplicaciones exigentes. Además, admite hasta 6 adaptadores PCIe Gen5 x16 y 1 OCP NIC 3.0, lo que mejora la conectividad.
Al combinar todos los nodos del clúster Lenovo hay una potencia combinada de 7.360 núcleos para cálculos, con 24.320 GB de RAM, siendo ideal para labores simultáneas. Por su parte, las 12 GPU AMD de ambos nodos del SR675 V3 proporciona un total de 79.872 de procesadores streams.
El Leftraru Epu, con un rendimiento de 260 TFlops, puede ejecutar cientos de billones de operaciones por segundo. Esto lo convierte en una herramienta clave para proyectos de gran escala, apoyada por una red de alta velocidad y una infraestructura sólida para procesar grandes volúmenes de datos.
El Laboratorio Nacional de Computación de Alto Rendimiento (NLHPC) ha sido fundamental para el desarrollo de investigaciones de alto impacto en diversas áreas del conocimiento. Veamos algunos de los casos de éxito más destacados:
Avances en Nanoelectrónica mediante el Control de Superficies e Interfaces, aplicaciones y métodos DFT, por Tania Sandoval PhD, Profesora Asociada. Ingeniería Civil Química, Universidad Técnica Federico Santa María:
Utilizando métodos de Teoría del Funcional de la Densidad (DFT), este proyecto investiga la nanoelectrónica, enfocándose en cómo controlar superficies e interfaces, lo cual es esencial para el desarrollo de nuevas tecnologías en dispositivos electrónicos.
Vigilancia molecular de cuerpos de agua continentales, por Daniel Medina Académico Investigador, Universidad San Sebastián, Sede de La Patagonia, Puerto Montt:
Este proyecto se enfoca en la vigilancia y monitoreo molecular de cuerpos de agua en Chile, empleando modelos computacionales avanzados para analizar la salud de los ecosistemas acuáticos y sus riesgos ambientales.
Explorando los Orígenes de los Rayos Cósmicos, por Mario Riquelme Hernandez, Académico, Universidad de Chile:
A través de simulaciones computacionales avanzadas, este proyecto busca entender los mecanismos detrás de la formación y propagación de los rayos cósmicos, elementos clave en la comprensión del universo.
(CR)2: Simulaciones climáticas regionales y marco de evaluación de la vulnerabilidad, por Maisa Rojas
Directora, Centro de Ciencia del Clima y la Resiliencia (CR)2
El Centro de Ciencia del Clima y la Resiliencia ((CR)2) utiliza la capacidad del clúster para realizar simulaciones climáticas regionales, contribuyendo a evaluar la vulnerabilidad de diversas zonas del país frente a los impactos del cambio climático.
ModelaCFD: Gemelos digitales para la acuicultura, Andrés Donoso Bravo, Chief Executive Officer, ModelaCFD
Este proyecto emplea gemelos digitales, simulaciones detalladas de sistemas acuícolas, para optimizar las prácticas de producción y mejorar la sostenibilidad en la industria acuícola chilena.
Estos casos de éxito demuestran la versatilidad y potencia del supercomputador Guacolda-Leftraru 2 en el apoyo a la ciencia y la innovación en Chile.
¿Qué te parece este poder cómputo disponible para la ciencia en Chile?