NVIDIA Blackwell NVL72 marca mejores tiempos en MLPerf 6.0

NVIDIA informó que su plataforma Blackwell NVL72 registró los menores tiempos de entrenamiento en las siete pruebas de MLPerf Training 6.0. La evaluación incluyó cargas nuevas con modelos mixture-of-experts, entrenamiento distribuido en miles de GPU y comparaciones entre sistemas GB200 NVL72 y GB300 NVL72.

NVIDIA impulsa la inteligencia artificial con el lanzamiento del superchip Blackwell GB200

NVIDIA Blackwell NVL72 cubrió todas las pruebas de MLPerf Training 6.0

La edición 6.0 de MLPerf Training incorporó pruebas con DeepSeek-V3 671B y GPT-OSS 20B, dos modelos de arquitectura mixture-of-experts. En estos sistemas, solo una parte del modelo se activa para procesar cada entrada, por lo que el entrenamiento depende tanto de la potencia de cálculo como de la comunicación entre GPU.

NVIDIA señala que Blackwell NVL72 conecta 72 GPU dentro de un rack mediante NVLink de quinta generación. Esa configuración permite trabajar con un conjunto compartido de cómputo y memoria, una condición relevante cuando miles de procesos deben coordinarse durante el entrenamiento.

Los tiempos informados para Blackwell NVL72 fueron los siguientes:

DeepSeek-V3 671B: 2,02 minutos.
GPT-OSS 20B: 7,43 minutos.
Llama 3.1 405B: 7,07 minutos.
Llama 2 70B LoRA: 0,40 minutos.
Llama 3.1 8B: 4,46 minutos.
FLUX.1: 17,1 minutos.
DLRM-dcnv2: 0,67 minutos.

NVIDIA Blackwell NVL72 fue la plataforma con menor tiempo de entrenamiento en las siete pruebas de MLPerf Training 6.0. | Créditos: NVIDIA

En la tabla de NVIDIA, solo tres de las siete pruebas muestran un tiempo para otra plataforma. En esos casos, la comparación queda así:

FLUX.1: de 74,44 minutos a 17,1 minutos.
Llama 2 70B LoRA: de 8,27 minutos en la alternativa a 0,40 minutos en Blackwell NVL72.
Llama 3.1 8B: de 58,63 minutos a 4,46 minutos.

GB300 NVL72 mejora frente a GB200 NVL72

NVIDIA comparó GB300 NVL72 con GB200 NVL72 en cargas de preentrenamiento; en los datos publicados por la firma, GB300 NVL72 fue hasta 1,6 veces más rápido, con diferencias asociadas a mayor densidad de cómputo, más capacidad de memoria y un límite de potencia superior.

NVIDIA presenta Blackwell Ultra y Rubin Ultra

Las mejoras mostradas por NVIDIA fueron las siguientes:

GPT-OSS 20B con 8 GPU: 1,3 veces frente a GB200 v6.0.
Llama 3.1 405B con 512 GPU: 1,5 veces frente a GB200 v5.1.
DeepSeek V3 con 512 GPU: 1,6 veces frente a GB200 v6.0.

GB300 NVL72 mostró mejoras de hasta 1,6 veces frente a GB200 NVL72 en cargas de preentrenamiento evaluadas por NVIDIA. | Créditos: NVIDIA

Blackwell escala hasta 8.192 GPU en MLPerf Training 6.0

Los resultados publicados por NVIDIA muestran un aumento sostenido en la escala de Blackwell dentro de MLPerf Training, con envíos que pasaron de 2.496 GPU en junio de 2025 a 5.120 GPU en noviembre del mismo año y a 8.192 GPU en junio de 2026.

Los resultados a mayor escala que se muestran en la imagen fueron los siguientes:

Microsoft Azure: Llama 3.1 405B en 7,07 minutos con GB200 NVL72.
CoreWeave: DeepSeek-V3 671B en 2,02 minutos con GB300 NVL72.
Escala máxima mostrada: 8.192 GPU en MLPerf Training 6.0.

Motorola lanza el Moto Pad 70 Groove con sistema de audio JBL de 9 altavoces

Habrá Motorola Razr 70 Swarovski Edition en color negro: esta es la evidencia concreta

Anthropic detectó tres incidentes en los que Claude atacó sistemas reales durante evaluaciones de ciberseguridad

Review Sony ZV-1 Mark II

Review Splatoon Raiders (Nintendo Switch 2)

Review Sony Walkman NW-WM1AM2

Apple prepara su esperado hub inteligente y podría llegar en octubre o inicios de 2027, según una filtración

POCO F9 Pro y F9 Ultra se filtran con baterías de hasta 10.000 mAh

Nothing podría seguir los pasos de OnePlus y salir de varios mercados globales

Paulo Bernardocki de Ericsson: “En smartglasses y wearables, la IA convierte al dispositivo en una interfaz de contexto”

Francisca Florenzano de Entel: “La brecha digital no puede ser el factor que aparte a las personas mayores”

[Parte 1] Danilo Muza de Samsung Chile: “La tecnología Micro RGB busca mostrar la imagen como fue concebida”

Aprende como activar la verificación en 2 pasos en la Clave Única

Alerta sísmica: Aprende a instalar y configurar Sismo Detector en tu iPhone y Android para saber segundos antes que va a temblar

Tecnología Micro RGB: ¿Qué es y cómo funciona el sistema de retroiluminación?

Super Mario Sunshine llega a Nintendo Switch Online + Expansion Pack en agosto

Un lanzamiento de amiibo sugiere que Zelda: Ocarina of Time Remake llegaría el 12 de noviembre

PlayStation Plus anuncia sus juegos mensuales de agosto: Dying Light 2, Big Walk y Signalis

NVIDIA Blackwell NVL72 entrena modelos de IA como DeepSeek-V3 y Llama 3.1 con los mejores tiempos en MLPerf 6.0

NVIDIA Blackwell NVL72 cubrió todas las pruebas de MLPerf Training 6.0

GB300 NVL72 mejora frente a GB200 NVL72

Blackwell escala hasta 8.192 GPU en MLPerf Training 6.0

Review Sony Walkman NW-WM1AM2

TCL presenta la barra de sonido Q95K con 1.420 W, sonido 11.1.4 y sonido Bang & Olufsen

Motorola lanzará la Moto Pad 70 Groove esta semana con 9 altavoces JBL

DJI confirma la fecha de lanzamiento internacional de la Osmo Pocket 4 Pro

Google Pixel Watch 5 aparece en Google Health antes de su presentación oficial

NVIDIA Blackwell NVL72 entrena modelos de IA como DeepSeek-V3 y Llama 3.1 con los mejores tiempos en MLPerf 6.0

NVIDIA Blackwell NVL72 cubrió todas las pruebas de MLPerf Training 6.0

GB300 NVL72 mejora frente a GB200 NVL72

Blackwell escala hasta 8.192 GPU en MLPerf Training 6.0

Suscríbete