Oracle Cloud Infrastructure incorpora GPUs NVIDIA Blackwell para ejecutar modelos de razonamiento e inteligencia artificial avanzada.

NVIDIA informó que uno de los primeros racks NVIDIA GB200 NVL72 con refrigeración líquida ya comenzó a operar en los centros de datos de Oracle, habilitando el uso de miles de GPUs Blackwell dentro de su infraestructura de nube.
El gigante de las GPU destaca que estas unidades ya están disponibles mediante NVIDIA DGX Cloud y Oracle Cloud Infrastructure (OCI), diseñadas para usar modelos de razonamiento de nueva generación y agentes de inteligencia artificial.
La escalabilidad es el secreto mejor guardado tras la infraestructura montada, ya que lo permite hacer realizar con baja latencia bajo dos tecnologías claves de NVIDIA:
Sobre la primera, NVIDIA explica:
«[…] Es la séptima generación de nuestra arquitectura InfiniBand líder en la industria, permite un rendimiento de 400 Gb/s, cómputo en red y un control de congestión avanzado para mejorar el rendimiento y la eficiencia en cargas de trabajo de inteligencia artificial y computación de alto rendimiento».
NVIDIA
En cuanto a la segunda, tiene la capacidad de realizar operaciones directamente dentro de la red para reducir la latencia, con esto puede:
Ambos, dos puntos claves para el procesamiento de altos volúmenes de datos, y por supuesto, clave para el tratamiento de cargas intensivas de trabajo intensivas de GenAI.
«[…] Es la primera plataforma Ethernet construida específicamente para inteligencia artificial, ofreciendo un rendimiento 1,6 veces superior y una escalabilidad masiva gracias al enrutamiento adaptativo, RDMA y la aceleración de comunicación entre GPUs».
NVIDIA
Gracias a la segunda tecnología que combina los switches Spectrum-4 con las SuperNIC BlueField-3, logra que la conexión entre las diferentes GPUS del rack alcancen velocidades de 400Gb/s con una gestión de tráfico de data de manera eficiente del tráfico:
Esta particularidad del ecosistema de NVIDIA es clave, ya que optimiza los procesos de razonamiento y entrenamiento de los modelos a gran escala.
Con esta infraestructura, Oracle tiene la capacidad de escalar su centro de datos de IA de manera ordenada, y de acuerdo a la demanda de inferencia, con alto rendimiento, eficiencia energética y opciones de despliegue flexibles.
Puntos claves:
Oracle Cloud Infrastructure (OCI) en un movimiento sin precedentes busca ser el primer actor del mercado en implementar estos sistemas, con una hoja de ruta que apunta a escalar su clúster de GPUs Blackwell a más de 100.000 unidades.