Google Cloud presenta la octava generación de TPU, diseñadas para dar soporte a la era de los agentes
Las TPU de última generación prometen un enorme aumento del rendimiento
- Google presenta la próxima generación de TPU: se divide en dos series, 8t y 8i
- Los superpods 8t pueden alcanzar los 121 exaflops, frente a los 42,5 del año pasado
- La serie 8i ofrece el triple de SRAM y más HBM
Google Cloud ha anunciado su octava generación de unidades de procesamiento Tensor (TPU), diseñadas específicamente para el cambio hacia la IA agentiva que estamos presenciando en la actualidad.
Presentadas en Google Cloud Next 2026, las mejoras se centran en ventanas de contexto más largas, razonamiento en múltiples pasos y capacidad de respuesta a gran escala, por lo que su infraestructura en la nube se está reconstruyendo para admitir memoria persistente, inferencia continua y cargas de trabajo multimodelo.
Este año, vemos dos TPU distintas diseñadas para admitir un escalado masivo de HBM, con Google Cloud poniendo tanto énfasis en el ancho de banda de la memoria como en la computación.
Los modelos TPU 8t y 8i apuntan a un entrenamiento de billones de parámetros en clústeres de millones de chips
La primera de las dos TPU, la 8t, se ha optimizado para distribuirse en enormes clústeres destinados al entrenamiento de modelos base. Con una mejora interanual de alrededor del 80 % en el rendimiento por dólar, la empresa afirma que permitirá entrenar modelos de billones de parámetros de manera más eficiente.
Google Cloud explicó que un solo superpod TPU 8t puede escalar hasta 9600 chips, proporcionando 2 PB de HBM compartida y 121 exaflops de computación. A modo de comparación, el año pasado Ironwood tenía una capacidad de hasta 9216 chips en un superpod y 42,5 exaflops.
Google Cloud también advirtió sobre «la barrera de la latencia» a la que nos enfrentamos en una era de agentes siempre activos, de ahí el lanzamiento de 8i, un segundo chip que sirve como motor de post-entrenamiento e inferencia.
El TPU 8i presenta un aumento de aproximadamente tres veces en la SRAM integrada, hasta 384 MB, así como 288 GB de HBM, con un tamaño de pod que ahora alcanza los 1,152 chips frente a los 256 anteriores, lo que ofrece un rendimiento de 11.6 exaflops (frente a los 1.2 exaflops anteriores).
Suscríbete a la newsletter TechRadar Pro para estar al día sobre noticias, análisis, opiniones y más para que tu empresa pueda tener éxito.
En cuanto a la eficiencia energética y térmica, Google Cloud presume de un rendimiento por vatio hasta dos veces superior al de Ironwood, su predecesor.
«Hemos innovado tanto en hardware como en software para permitir que nuestros centros de datos ofrezcan seis veces más potencia de cálculo por unidad de electricidad que hace tan solo cinco años», explicó Amin Vahdat, vicepresidente sénior y director tecnológico de IA e infraestructura.
Se espera que esté disponible para los clientes de Google Cloud en los próximos meses y, naturalmente, TPU 8t y TPU 8i estarán a la vanguardia de los últimos modelos Gemini.
La empresa también considera que el hardware de octava generación desempeñará un papel importante en el desarrollo de los próximos modelos de vanguardia, al distribuir el entrenamiento más allá de un solo superpod mediante el uso de Pathways y JAX para alcanzar una escalabilidad superior al millón de chips TPU por cada clúster de entrenamiento; algo que, según confirmaron los ejecutivos en el evento, es por el momento totalmente teórico (aunque técnicamente posible), ya que las TPU aún no están disponibles a tal escala.
Sigue a TechRadar en Google News y añádenos como fuente preferida para recibir nuestras noticias, reseñas y opiniones de expertos en tus feeds. ¡No olvides hacer clic en el botón "Seguir"!
Y, por supuesto, también puedes seguir a TechRadar en TikTok para ver noticias, reseñas y unboxings en formato de video, además de recibir actualizaciones periódicas de nuestra parte en WhatsApp.
