AWS anuncia la plataforma Trn3 UltraServers que incorpora el procesador Trainium3 de 3nm con 144 chips por instancia

Amazon Web Services (AWS) ha confirmado la disponibilidad de Amazon EC2 Trn3 UltraServers, que incorporan el procesador Trainium3 fabricado bajo un proceso de litografía de 3nm.

Esta actualización de hardware está orientada a cargas de trabajo de entrenamiento masivo e inferencia de IA, aumentando la densidad computacional disponible por rack respecto a la arquitectura previa.

Especificaciones de interconexión y roadmap de semiconductores

El diseño del servidor consolida hasta 144 chips Trainium3 en una única unidad lógica, alcanzando un rendimiento de cómputo 4,4 veces mayor frente a las instancias basadas en Trainium2. La comunicación interna se gestiona mediante NeuronSwitch-v1, un componente que duplica el ancho de banda por servidor y disminuye la latencia entre procesadores a menos de 10 microsegundos.

Módulo de silicio del Trainium3 en versión Engineering Sample (ES), diseñado por Annapurna Labs, la división de semiconductores de AWS. El encapsulado muestra el código ALM14811 y dos dies visibles bajo la ventana superior, correspondientes a la arquitectura multi-chip empleada en la tercera generación de aceleradores para entrenamiento de IA | Créditos: AWS

La eficiencia energética reportada indica una reducción del 40% en el consumo comparado con generaciones anteriores, un parámetro esencial para la viabilidad operativa en grandes centros de datos.

La arquitectura soporta la implementación de EC2 UltraClusters 3.0, permitiendo la interconexión de hasta un millón de chips para el entrenamiento de modelos fundacionales.

Arquitectura del Trainium3 y sus núcleos NeuronCore-v4

El diseño interno del chip Trainium3 se estructura en torno a ocho núcleos NeuronCore-v4, los cuales introducen soporte para la Configuración Lógica de NeuronCore (LNC). Esta funcionalidad permite agregar los recursos de memoria y cómputo de múltiples núcleos físicos para que sean direccionados por el software como una única unidad lógica de mayor capacidad.

Arquitectura del Trainium3 | Créditos: AWS

El subsistema de memoria está respaldado por stacks de tecnología HBM que proporcionan una capacidad de hasta 144 GiB por dispositivo y un ancho de banda de 4,7 TB/s, esencial para minimizar los cuellos de botella en el movimiento de tensores.

Además, el chip integra 128 motores DMA y cuatro enlaces NeuronLink-v4, optimizando el flujo de datos tanto dentro del encapsulado como hacia otros dispositivos del servidor.

Trainium4

En cuanto a la hoja de ruta, AWS adelantó las métricas para Trainium4, estimando un aumento de 6x en rendimiento FP4 y 3x en FP8. Esta futura generación adoptará la tecnología de interconexión NVIDIA NVLink Fusion, lo que habilitará la construcción de racks MGX capaces de operar con hardware heterogéneo.

Ivan

Editor especializado en ciencia y tecnología, con foco en innovación, inteligencia artificial, telecomunicaciones y centros de datos. Trabajo con un enfoque riguroso y técnico, desarrollando contenidos sobre semiconductores, energía, ciberseguridad e infraestructura tecnológica.

Los comentarios de Disqus están cargando....

Publicado por

Ivan

Tags: awsdata centersIANeuronCoreprocesadoresTrainium2Trainium3

3 meses

AWS anuncia la plataforma Trn3 UltraServers que incorpora el procesador Trainium3 de 3nm con 144 chips por instancia

Especificaciones de interconexión y roadmap de semiconductores

Arquitectura del Trainium3 y sus núcleos NeuronCore-v4

Trainium4

Noticias relacionadas