La matriz GB202 «Blackwell» de NVIDIA al descubierto, muestra la enorme configuración de 24.576 núcleos CUDA
Masterbitz
27 ene2 Min. de lectura
Ha aparecido en Internet una imagen del chip GB202 de NVIDIA, el silicio de la RTX 5090, que proporciona información detallada sobre la disposición física de la arquitectura «Blackwell». Las imágenes comentadas, compartidas por el analista de hardware Kurnal y facilitadas por el director general de ASUS China, Tony Yu, comparan la GB202 con su predecesora AD102 y describen los componentes arquitectónicos clave. La región central del chip alberga 128 MB de caché L2 (96 MB en la RTX 5090), rodeada de interfaces de memoria. Ocho controladores de memoria de 64 bits soportan la interfaz GDDR7 de 512 bits, con interfaces físicas situadas a lo largo de los bordes superior, izquierdo y derecho de la matriz. Doce clústeres de procesamiento gráfico (GPC) rodean la caché central. Cada GPC contiene ocho clusters de procesamiento de texturas (TPC), y cada GPC alberga 16 multiprocesadores de streaming (SM). La configuración completa de la matriz permite 24.576 núcleos CUDA, dispuestos en 128 núcleos por SM a lo largo de 192 SM. La RTX 5090 ofrece «sólo» 21.760 núcleos CUDA, lo que significa que toda la GB202 está reservada para las GPU de estaciones de trabajo.
El diseño SM incluye cuatro secciones que comparten 128 KB de caché L1 y cuatro unidades de mapeo de texturas (TMU). Cada segmento del SM contiene archivos de registro dedicados, cachés de instrucciones L0, programadores warp, unidades de carga-almacenamiento y unidades de funciones especiales. En el centro de la disposición del chip hay una franja vertical que contiene los componentes de procesamiento de medios (las unidades NVDEC y NVENC) y que se extiende de arriba abajo. La implementación de RTX 5090 permite tres de los cuatro codificadores NVENC disponibles y dos de los cuatro decodificadores NVDEC. La matriz incluye doce bloques raster engine/3D FF para el procesamiento de la geometría. En el borde inferior se sitúan la interfaz PCIe 5.0 x16 y los componentes del controlador de pantalla. A pesar de su considerable tamaño, la GB202 sigue siendo más pequeña que las anteriores placas GH100 y GV100 de NVIDIA, que superaban los 814 mm². Cada SM integra hardware especializado, incluidos los nuevos núcleos Tensor de 5ª generación y los núcleos RT de 4ª generación, que contribuyen al total de 192 núcleos RT, 768 núcleos Tensor y 768 unidades de textura de la matriz.
Fuentes: ASUS China Tony Yu, Kurnal on X, vía VideoCardz
Comentarios