Masterbitz
AMD Instinct MI200: Chiplet de doble GPU; arquitectura CDNA2; 128 GB HBM2E
AMD ha anunciado hoy el debut de su arquitectura CDNA2 (Compute-DNA) de 6 nm en forma de la familia MI200. El nuevo acelerador de chip de doble GPU pretende llevar a AMD a una nueva era de aplicaciones de computación de alto rendimiento (HPC), el territorio de alto margen en el que necesita competir para un crecimiento continuo y sostenible. Para ello, AMD ha mejorado aún más una arquitectura madura y orientada a la computación, nacida con Graphics Core Next (GCN), y ha conseguido mejorar el rendimiento al tiempo que ha reducido el tamaño total de la matriz en comparación con su familia MI100.
El acelerador MI250X de AMD cuenta con dos chips de cálculo con 58.000 millones de transistores fabricados en el proceso de 6 nm de TSMC. Cada uno de estos chips cuenta con un total de 110 unidades de cálculo (CUs) para un total de 220 CUs en un solo acelerador. La nueva arquitectura CDNA2 también incorpora nuevos y mejorados Matrix Cores con 880 unidades (440 por chip). Y tal como está configurada la MI250X, esa increíble cantidad de potencia de GPU se combina con 128 GB de memoria HBM2E, que funciona a 3,2 TB/s. Las estimaciones de rendimiento de AMD en comparación con la actual generación de A100 de NVIDIA son impresionantes. Comparado con el A100, el MI250X es: 4,9 veces más rápido en el cálculo vectorial FP64; 2,5 veces más rápido en FP 32 Vector; 4,9 veces más rápido en FP64 Matrix; un rendimiento más escaso de 1,2 veces más rápido en las operaciones FP16 y BF16 Matrix; una capacidad de memoria 1,6 veces mayor (128 GB en el MI 250X frente a los 80 GB del A100); y un ancho de banda de memoria 1,6 veces más rápido (aunque esto se deriva de la memoria HBM2E más rápida).
Las dos matrices CDNA2 están conectadas entre sí con el Infinity Fabric de AMD, que debuta en una arquitectura gráfica. Este enlace proporciona una serie de enlaces de 25 Gbps que ofrecen hasta 100 GB/s de ancho de banda bidireccional entre ambas GPU. Hay ocho enlaces disponibles en el módulo de distribución de la MI200, construido según las especificaciones de una configuración OAM (OCP Accelerator Module, donde OCP significa "Open Compute Platform"). En total se dispone de 800 GB/s de ancho de banda para la comunicación sobre la marcha entre los dos chiplets. AMD ya ha anunciado que en el futuro se lanzará una versión PCIe del MI200, que servirá para aquellos que sólo quieran sustituirlo o actualizarlo.
El uso por parte de AMD de la tecnología de fabricación N6 de TSMC puede explicar sin duda parte de la mejora del rendimiento y del tamaño de la matriz. Como cualquier otro fabricante, AMD se esfuerza por optimizar el rendimiento. Esto queda claro cuando observamos el otro producto que AMD presenta junto al MI250X: el acelerador MI250. El MI250 se ve afectado por los recursos computacionales, ya que pasa de las 110 CUs del MI250X a 104 CUs por chiplet. En realidad, ese es el único cambio; debería ser un 5% más lento que el MI250X totalmente habilitado.
