El sistema CloudMatrix 384 de Huawei supera al GB200 NVL72 de NVIDIA
Masterbitz
16 abr
2 Min. de lectura
Huawei ha anunciado su supernodo de sistema CloudMatrix 384, que la compañía promociona como su propia alternativa doméstica al sistema GB200 NVL72 de NVIDIA, con más rendimiento global del sistema pero peor rendimiento por chip y mayor consumo de energía. Mientras que el GB200 NVL72 de NVIDIA utiliza 36 CPU Grace emparejadas con 72 GPU GB200 «Blackwell», el sistema CloudMatrix 384 de Huawei emplea 384 aceleradores Huawei Ascend 910C para superar al sistema GB200 NVL72 de NVIDIA. Se necesitan aproximadamente cinco veces más aceleradores Ascend 910C para ofrecer casi el doble de rendimiento que el sistema GB200 NVL, lo que no es bueno en el sesgo por acelerador, pero es excelente en el nivel de despliegue por sistema. SemiAnalysis sostiene que Huawei está una generación por detrás en rendimiento de chips, pero por delante de NVIDIA en diseño e implantación de sistemas a escala.
Si nos fijamos en los chips individuales, el GB200 NVL72 de NVIDIA supera claramente al Ascend 910C de Huawei, ya que ofrece más del triple de rendimiento que el BF16 (2.500 TeraFLOPS frente a 780 TeraFLOPS), más memoria en el chip (192 GB frente a 128 GB) y un ancho de banda más rápido (8 TB/s frente a 3,2 TB/s). En otras palabras, NVIDIA tiene la ventaja en potencia bruta y eficiencia a nivel de chip. Pero si pasamos al nivel de sistema, el CloudMatrix CM384 de Huawei toma la delantera. Produce 1,7 veces más PetaFLOPS, tiene 3,6 veces más capacidad total de HBM y admite más de cinco veces el número de GPU y el ancho de banda asociado que el clúster NVL72 de NVIDIA. Sin embargo, esta escalabilidad tiene su contrapartida, ya que la configuración de Huawei consume casi cuatro veces más energía total. Un solo GB200 NVL72 consume 145 kW de energía, mientras que un solo CloudMatrix 384 de Huawei consume ~560 kW. Por tanto, NVIDIA es tu opción si necesitas la máxima eficiencia en una sola GPU. Si estás construyendo un supercluster de IA masivo en el que el rendimiento total y la velocidad de interconexión son lo más importante, la solución de Huawei tiene mucho sentido. Gracias a su topología «todo a todo», Huawei ha creado un sistema de entrenamiento e inferencia de IA que merece la pena adquirir. Cuando SMIC, el fabricante de los chips de Huawei, llegue a un nodo de fabricación más avanzado, la eficiencia de estos sistemas también aumentará.
Comentários