• Masterbitz

El documento técnico de NVIDIA sobre el Hopper revela las principales especificaciones del monstruos

El silicio GH100 de NVIDIA que alimenta la nueva generación de procesadores de computación NVIDIA H100 es una monstruosidad sobre el papel, y un documento técnico de NVIDIA publicado este fin de semana revela sus principales especificaciones. NVIDIA está aprovechando el nodo de fabricación de silicio más avanzado actualmente disponible en TSMC para construir el chip de cálculo, que es el TSMC N4 (4 nm-class EUV). El H100 cuenta con un silicio monolítico rodeado de hasta seis pilas de HBM3 en el paquete.


El GH100 está construido en el proceso EUV de 4 nm y cuenta con un monstruoso número de transistores de 80.000 millones, lo que supone un aumento de casi el 50% con respecto al GA100. Sin embargo, el área de la matriz del GH100, de 814 mm², es inferior a la del GA100, cuya matriz de 826 mm² está construida en el nodo DUV de 7 nm (TSMC N7), gracias a la mayor densidad de transistores del nodo de 4 nm respecto al de 7 nm.


La jerarquía de componentes de la GH100 es similar a la de las arquitecturas NVIDIA de generaciones anteriores. La principal maquinaria de cálculo está repartida en 144 multiprocesadores de flujo (SM). El chip cuenta con 18.432 núcleos CUDA FP32 y 9.216 núcleos CUDA de doble precisión (FP64). También hay 576 núcleos Tensor de cuarta generación. Uno de los GPC del silicio tiene hardware de gráficos de trama, por lo que el silicio tiene ciertas capacidades de GPU.


El GH100 cuenta con una interfaz de memoria HBM3 de 6144 bits, y 80 GB es la cantidad de memoria estándar para el procesador de cálculo H100. Se espera que el ancho de banda de la memoria ofrecida supere los 3 TB/s, incluido el soporte de ECC. Las interfaces de host también reciben una importante actualización. La placa de factor de forma SXM viene con la interconexión NVLink de última generación que tiene un ancho de banda de 900 GB/s.


El modelo de factor de forma AIC (tarjeta complementaria) tiene PCI-Express 5.0 x16 (128 GB/s). Ambas interfaces introducen funciones de agrupación de recursos. Por último, NVIDIA está aumentando la potencia en busca de rendimiento, ya que la H100 tiene un valor de potencia típico de 700 W, en comparación con los 400 W de la A100. Resulta interesante que la H100 no llegue al máximo del silicio de la GH100, ya que la placa de alta densidad con factor de forma SXM cuenta con 132 de 144 SM, mientras que la placa PCIe AIC sólo tiene 114 de 144. Ambos modelos podrían venir con velocidades de reloj de hasta 1,80 GHz.


Fuente: ComputerBase.de

4 visualizaciones0 comentarios