AMD publica el diagrama de bloques de su GPU HPC CDNA2 MI250X "Aldebaran
En su presentación de HotChips 22, AMD ha hecho público un diagrama de bloques de su mayor procesador de IA-HPC, el Instinct MI250X. Basado en la arquitectura de computación CDNA2, el corazón del MI250X es el MCM (módulo multichip) "Aldebaran". Este MCM contiene dos chips lógicos (chips de la GPU) y ocho pilas de HBM2E, cuatro por cada chip de la GPU. Las dos GPU dies están conectadas por un enlace Infinity Fabric de 400 GB/s. Cada una de ellas dispone de hasta 500 GB/s de ancho de banda Infinity Fabric externo para las comunicaciones entre chips, y PCI-Express 4.0 x16 como bus de sistema anfitrión para los factores de forma AIC. Los dos chips de la GPU suman 58.000 millones de transistores y están fabricados en el nodo N6 (6 nm) de TSMC.
En la jerarquía de componentes de cada troquel de la GPU, ocho motores de sombreado comparten una caché L2 de último nivel. Los ocho motores de sombreado suman un total de 112 unidades de cálculo, es decir, 14 CU por motor. La unidad de cálculo CDNA2 contiene 64 procesadores de flujo que constituyen el núcleo de sombreado y cuatro unidades de núcleo de matriz. Se trata de hardware especializado en operaciones matemáticas matriciales/tensoriales. Por tanto, hay 7.168 procesadores de flujo por matriz de GPU, y 14.336 por paquete. AMD afirma que el rendimiento del cálculo de doble precisión es un 100% superior al de la CDNA (MI100). AMD lo atribuye al aumento de las frecuencias, a la eficiencia de las rutas de datos, a la amplia reutilización y reenvío de operandos y a la optimización de la energía que permite esos relojes más altos. El MI200 ya está alimentando el superordenador Frontier, y está trabajando para conseguir más victorias de diseño en el espacio HPC. La compañía también ha dejado caer que el MI300, basado en CDNA3, será una APU. Incorporará los troqueles de la GPU, el núcleo lógico y los CCD de la CPU en un solo paquete, en lo que es una solución rival de la NVIDIA Grace Hopper Superchip.