Ironwood, la apuesta de Google por un TPU eficiente para tareas de inferencia

Los anuncios durante el Google Cloud Next 25, fueron muchos, pero en materia de hardware fueron pocos; sin embargo, no por eso, significa que no sea importante. La gran G presentó una nueva generación de su familia de Tensor Processing Units (TPU), diseñada exclusivamente para tareas de inferencia, llamada Ironwood.

Recordemos que las TPU son chips desarrollados por Google que ejecutan modelos de aprendizaje automático de manera muy eficiente, especialmente aquellos modelos con redes neuronales profundas.

Las TPU están pensadas para optimizar procesos de álgebra matricial, que son fundamentales en las tareas para el procesamiento de lenguaje natural y predicciones generativas.c

Mejora en el rendimiento total máximo en FP8 en comparación con la TPU v2, la primera TPU de Google disponible externamente en la nube. | Imagen créditos: Google Cloud

En cuanto al rendimiento, la nueva TPU de Google, Ironwood, marca una diferencia notable. Este nuevo chip no requiere un sistema de refrigeración líquida como sus antecesores, ni infraestructura de data center especializada. Esto permite una implementación sea más fácil y más eficiente desde el punto de vista de consumo de energía.

Su arquitectura se adapta a infraestructuras estándar, orientada a entornos donde se ejecutan modelos ya entrenados.

Comparación lado a lado de las especificaciones técnicas de los productos Cloud TPU con topología de toro 3D, incluyendo la generación más reciente, Ironwood de Google — Comparación lado a lado de las especificaciones técnicas de los productos Cloud TPU con topología de toro 3D, incluyendo la generación más reciente, Ironwood. El rendimiento máximo en FP8 para v4 y v5p está emulado, mientras que en Ironwood es compatible de forma nativa. | Imagen créditos: Google Cloud

Al ver la tabla anterior, se observa que la configuración de pods en Ironwood alcanza hasta 9.216 chips, superando loa 8960 de la TPU v5p. En cuanto a la memoria, el crecimiento es exponencial con 192 GB de memoria tipo HBM, que tiene un ancho de banda de 7.4 TB/s.

Esta configuración del Inronwood, permite la ejecución de modelos de lenguajes más complejos, y permitir trabajos en paralelo y dar respuesta a múltiples clientes en simultáneo.

Uno de los datos más destacables es su rendimiento máximo por chip: 4.614 TFLOPS, una cifra muy superior a los 459 TFLOPS de v5p. Este aumento refleja la apuesta de Google por una aceleración profunda en tareas de inferencia, enfocándose en reducir la latencia y optimizar el uso energético.

Mejora en la eficiencia energética de las TPU de Google en comparación con la primera generación Cloud TPU v2. Medida en FLOPS máximos en FP8 entregados por vatio de potencia térmica de diseño por encapsulado de chip. | Imagen créditos: Google Cloud

IIronwood no es la primera TPU de Google, pero sí representa la primera en enfocarse exclusivamente en la inferencia, ¿El camino escogido por Google será el correcto para el futuro del hardware de las IA?

Fuente: Google

Realme 14T 5G viene con una monstruosa batería de 6.000 mAh

Yahoo también expresa su interés en adquirir Chrome

Moto AI: Motorola establece alianza con Google, Meta, Microsoft y Perplexity

Review Samsung Galaxy A56

Primeras impresiones HUAWEI Pura X

Review Apple iPhone 16e

La familia iPhone 17 vendría con 12GB de memoria RAM

Galaxy S25 Edge: Evan Blass comparte sus especificaciones y Samsung publica por error sus precios

Xperia 1 VII de Sony se filtra en imágenes y especificaciones

¿Podrá el Proyecto de Ley de Inteligencia Artificial enfrentar el desafío tecnológico en Chile?

Redes sociales: el precio que pagamos por vivir a través de una pantalla

Cargador universal: ¿Solución real o solo otro parche?

[Video] Estas son todas las funciones de Awesome Intelligence, el set de IA de Samsung en el Galaxy A56, y como usarlas

Estaciones de carga portátiles: ¿Qué son, cómo funcionan y en qué se diferencian de una powerbank?

Samsung Galaxy A36 vs A35: Detallamos sus diferencias clave en pantalla, rendimiento y cámaras

Ghost of Yōtei se lanzará para PlayStation 5 el 2 de octubre y nos ofrecen un nuevo trailer

La PlayStation 5 se actualiza con enfoque de audio y personalización de la interfaz con los diseños clásicos

Pandoland: el nuevo juego móvil de Game Freak, el desarrollador detrás de Pokémon

Ironwood, la apuesta de Google por un TPU eficiente para tareas de inferencia

Fuente: Google

Starlink lanzará un router de cuarta generación que vendrá en el nuevo Kit Mini con velocidades de descarga más rápidas

Xperia 1 VII de Sony se filtra en imágenes y especificaciones

Motorola Edge 60 Fusion es presentado para Chile y el resto de Latinoamérica

One UI 7 llega a las series Galaxy S23, Galaxy Tab S9, Tab S10 y Galaxy S24 FE

Oficial: Se anuncia preventa oficial de la Nintendo Switch 2 en Chile con un precio que parte en los CLP $629.990

Ironwood, la apuesta de Google por un TPU eficiente para tareas de inferencia

Fuente: Google

Suscríbete