top of page
IG.png

NVIDIA «Blackwell Ultra» incorpora PCIe Gen 6 y un aumento del rendimiento de 1,5 veces con NVFP4.

  • Foto del escritor: Masterbitz
    Masterbitz
  • 25 ago
  • 2 Min. de lectura

El esperado "Blackwell Ultra" de NVIDIA es la forma final de la familia Blackwell antes de la transición a "Rubin". Sin embargo, este silicio no parece compartir mucho parecido con sus predecesores, especialmente en términos de I/S y rendimiento. En su blog, NVIDIA detalló el diseño de silicio de su última creación y todas las características de acompañamiento como soporte de software mejorado y optimizaciones. Uno de los aspectos más llamativos del Blackwell Ultra, diseñado para servidores de IA, es su uso de PCIe Gen 6, mientras que el consumidor Blackwell y el servidor regular Blackwell utilizan PCIe Gen 5. Fabricado usando el nodo TSMC 4NP, el chip Ultra masivo cuenta con 208 mil millones de transistores, que es 2,6 veces más que la última generación Hopper, basado únicamente en el conteo de transistores crudos. Esto viene con un TDP de 1.400 W, lo que significa que un sistema de enfriamiento masivo es una necesidad.

Cuando se trata de rendimiento, Blackwell Ultra ofrece aproximadamente 1,5 veces el cómputo NVFP4 denser en comparación con Blackwell, resultando en una mayor ficha en la inferencia y mejor rendimiento para entrenamiento de gran tala. El chip combina 160 SMs en dos retículas muere a través del enlace NV-HBI de NVIDIA, trayendo un tejido de 10 TB/s muda a morir, 288 GB de HBM3E en hasta 8 TB/s ancho de banda, y Tensor Cores de quinta generación sintonizado para NVFP4. El rendimiento de la capa de atención se beneficia del doble desempeño de unidades de función especial (SFU) para operaciones trascendentales, reduciendo la latencia suave y mejorando la capacidad de respuesta a la razón.

   

A escala del sistema, NVIDIA posiciona el GB300 NVL72 como la construcción principal: racks refrigerados por líquido construidos a partir de Grace Blackwell Ultra Superchips alcanzan el FP4 denso de clase exascale y ofrecen ganancias sustanciales en las plataformas de rendimiento por megagavatio frente a las plataformas HGX anteriores. Los cambios de software son igualmente importantes; CUDA sigue siendo totalmente soportado, mientras que marcos como TensorRT-LLM, programación de Dynamo y optimizadores de modelos conscientes de precisión aprovechan NVFP4 y la topología de doble muerte para aumentar la utilización y reducir el costo por ficha. Características empresariales, como partición MIG avanzada, computación confidencial TEE-I/O, descompresión de hardware y telas NVLink expandidas, completan la plataforma para fábricas de IA multiinquilino. Para los operadores de centro de datos que buscan densidad y eficiencia, Blackwell Ultra está diseñado para mayores huellas de memoria en el chip, un E/S host más ajustado con PCIe Gen 6, y codiseño de software-hardware que prioriza la escala de inferencia y la estabilidad operativa.

Fuente: NVIDIA

Comentarios


Aplus_MARS_2107_Eng(1).png
undefined - Imgur(1).jpg

Siguenos

  • Facebook
  • Twitter
  • YouTube
  • Instagram
gaming

© 2016 Derechos Reservados a MasterbitzReviewHN

bottom of page