top of page

NVIDIA «Blackwell Ultra» incorpora PCIe Gen 6 y un aumento del rendimiento de 1,5 veces con NVFP4.

Masterbitz
25 ago
2 Min. de lectura

El esperado "Blackwell Ultra" de NVIDIA es la forma final de la familia Blackwell antes de la transición a "Rubin". Sin embargo, este silicio no parece compartir mucho parecido con sus predecesores, especialmente en términos de I/S y rendimiento. En su blog, NVIDIA detalló el diseño de silicio de su última creación y todas las características de acompañamiento como soporte de software mejorado y optimizaciones. Uno de los aspectos más llamativos del Blackwell Ultra, diseñado para servidores de IA, es su uso de PCIe Gen 6, mientras que el consumidor Blackwell y el servidor regular Blackwell utilizan PCIe Gen 5. Fabricado usando el nodo TSMC 4NP, el chip Ultra masivo cuenta con 208 mil millones de transistores, que es 2,6 veces más que la última generación Hopper, basado únicamente en el conteo de transistores crudos. Esto viene con un TDP de 1.400 W, lo que significa que un sistema de enfriamiento masivo es una necesidad.

Cuando se trata de rendimiento, Blackwell Ultra ofrece aproximadamente 1,5 veces el cómputo NVFP4 denser en comparación con Blackwell, resultando en una mayor ficha en la inferencia y mejor rendimiento para entrenamiento de gran tala. El chip combina 160 SMs en dos retículas muere a través del enlace NV-HBI de NVIDIA, trayendo un tejido de 10 TB/s muda a morir, 288 GB de HBM3E en hasta 8 TB/s ancho de banda, y Tensor Cores de quinta generación sintonizado para NVFP4. El rendimiento de la capa de atención se beneficia del doble desempeño de unidades de función especial (SFU) para operaciones trascendentales, reduciendo la latencia suave y mejorando la capacidad de respuesta a la razón.

A escala del sistema, NVIDIA posiciona el GB300 NVL72 como la construcción principal: racks refrigerados por líquido construidos a partir de Grace Blackwell Ultra Superchips alcanzan el FP4 denso de clase exascale y ofrecen ganancias sustanciales en las plataformas de rendimiento por megagavatio frente a las plataformas HGX anteriores. Los cambios de software son igualmente importantes; CUDA sigue siendo totalmente soportado, mientras que marcos como TensorRT-LLM, programación de Dynamo y optimizadores de modelos conscientes de precisión aprovechan NVFP4 y la topología de doble muerte para aumentar la utilización y reducir el costo por ficha. Características empresariales, como partición MIG avanzada, computación confidencial TEE-I/O, descompresión de hardware y telas NVLink expandidas, completan la plataforma para fábricas de IA multiinquilino. Para los operadores de centro de datos que buscan densidad y eficiencia, Blackwell Ultra está diseñado para mayores huellas de memoria en el chip, un E/S host más ajustado con PCIe Gen 6, y codiseño de software-hardware que prioriza la escala de inferencia y la estabilidad operativa.

Fuente: NVIDIA

Entradas recientes

El próximo evento GTC de NVIDIA vuelve a San José el 15 de marzo de 2026, donde se espera que el director ejecutivo Jensen Huang describa la próxima era de la infraestructura de IA.

El próximo evento GTC de NVIDIA vuelve a San José el 15 de marzo de 2026, donde se espera que el director ejecutivo Jensen Huang describa la próxima era de la infraestructura de IA.

Se filtran los resultados de las pruebas de rendimiento de la iGPU Intel Panther Lake «Arc B390»: un 16 % más rápida que la AMD Radeon 890M y un 83 % más rápida que la Lunar Lake «Arc 140V».

Se filtran los resultados de las pruebas de rendimiento de la iGPU Intel Panther Lake «Arc B390»: un 16 % más rápida que la AMD Radeon 890M y un 83 % más rápida que la Lunar Lake «Arc 140V».

La Radeon RX 9070 alcanza su precio más bajo hasta la fecha; la RTX 5050 también baja hasta solo 209 dólares.

La Radeon RX 9070 alcanza su precio más bajo hasta la fecha; la RTX 5050 también baja hasta solo 209 dólares.

Comentarios

Aplus_MARS_2107_Eng(1).png

bottom of page