
Amazon Web Services (AWS) ha confirmado la disponibilidad de Amazon EC2 Trn3 UltraServers, que incorporan el procesador Trainium3 fabricado bajo un proceso de litografía de 3nm.
Esta actualización de hardware está orientada a cargas de trabajo de entrenamiento masivo e inferencia de IA, aumentando la densidad computacional disponible por rack respecto a la arquitectura previa.
El diseño del servidor consolida hasta 144 chips Trainium3 en una única unidad lógica, alcanzando un rendimiento de cómputo 4,4 veces mayor frente a las instancias basadas en Trainium2. La comunicación interna se gestiona mediante NeuronSwitch-v1, un componente que duplica el ancho de banda por servidor y disminuye la latencia entre procesadores a menos de 10 microsegundos.
La eficiencia energética reportada indica una reducción del 40% en el consumo comparado con generaciones anteriores, un parámetro esencial para la viabilidad operativa en grandes centros de datos.
La arquitectura soporta la implementación de EC2 UltraClusters 3.0, permitiendo la interconexión de hasta un millón de chips para el entrenamiento de modelos fundacionales.
El diseño interno del chip Trainium3 se estructura en torno a ocho núcleos NeuronCore-v4, los cuales introducen soporte para la Configuración Lógica de NeuronCore (LNC). Esta funcionalidad permite agregar los recursos de memoria y cómputo de múltiples núcleos físicos para que sean direccionados por el software como una única unidad lógica de mayor capacidad.
El subsistema de memoria está respaldado por stacks de tecnología HBM que proporcionan una capacidad de hasta 144 GiB por dispositivo y un ancho de banda de 4,7 TB/s, esencial para minimizar los cuellos de botella en el movimiento de tensores.
Además, el chip integra 128 motores DMA y cuatro enlaces NeuronLink-v4, optimizando el flujo de datos tanto dentro del encapsulado como hacia otros dispositivos del servidor.
En cuanto a la hoja de ruta, AWS adelantó las métricas para Trainium4, estimando un aumento de 6x en rendimiento FP4 y 3x en FP8. Esta futura generación adoptará la tecnología de interconexión NVIDIA NVLink Fusion, lo que habilitará la construcción de racks MGX capaces de operar con hardware heterogéneo.