• Masterbitz

NVIDIA Anuncia el Sistema DGX-2 - 16x Tesla V100 GPU, 30 TB NVMe Memory por $ 400K


El DGX-2 de NVIDIA es probablemente la razón por la que NVIDIA parece estar un poco menos enamorado del mercado de tarjetas gráficas para el consumidor últimamente. Seamos honestos: solo mire esa etiqueta de precio, e imagine los ríos de dinero que NVIDIA está generando en cada uno de estos sistemas vendidos. El centro de datos y los mercados de aprendizaje profundo han estado invirtiendo dinero en las arcas de NVIDIA, por lo que la compañía está enfocando sus esfuerzos en este espacio. Ejemplo: el DGX-2, que presenta el rendimiento deportivo de 1920 TFLOP (procesamiento Tensor); 480 TFLOPs de FP16; la otra mitad ese valor en 240 TFLOP para cargas de trabajo FP32; y 120 TFLOP en FP64.

El DGX-2 de NVIDIA se basa en el DGX-1 original en todos los aspectos posibles. NVIDIA los considera como potencias de procesamiento de fácil implementación, que incluyen todo lo que cualquier usuario potencial que requiera grandes cantidades de potencia de procesamiento puede implementar en un solo sistema. Y el DGX-2 simplemente ejecuta vueltas alrededor del DGX-1 (que originalmente se vendió por $ 150K) en todos los aspectos: presenta 16x 32GB Tesla V100 GPU (el DGX-1 presentó 8x 16 GB Tesla GPU); 1.5 TB de ram del sistema (el DGX-1 tiene una insignificante 0.5 TB); 30 TB de almacenamiento en el sistema NVMe (el DGX-1 tenía 8 TB de espacio de almacenamiento), e incluso incluye un par de CPU Xeon Platinum (sin duda, el aumento de rendimiento más bajo en todo el sistema).

El DGX-2 ha sido posible gracias a la implementación de NVIDIA de lo que llama NVSwitch, que permite una comunicación de chip a chip de 300 GB / s a ​​12 veces la velocidad de PCIe. Junto con NVLink2 de la compañía, esto permite que dieciséis GPU se agrupen en un solo sistema, para un ancho de banda total que va más allá de 14 TB / s. NVIDIA lo promociona como un sistema compatible con 2 Petaflop, que no es tan difícil de imaginar con todo el hardware subyacente; incluye 81.920 núcleos CUDA y 10.240 núcleos de procesamiento de Tensor (que son los que NVIDIA usa para lograr ese 2 Petaflop figura, si se lo estuviera preguntando. El DGX-2 consume energía que es adecuada para sus entrañas, unos 10 KW de potencia en operación, y todo el sistema pesa 350 libras.

A continuación, se incluyen algunas de las observaciones de NVIDIA sobre este sistema: NVSwitch: una tela de interconexión revolucionaria NVSwitch ofrece un ancho de banda 5 veces mayor que el mejor conmutador PCIe, lo que permite a los desarrolladores construir sistemas con más GPU hiperconectadas entre sí. Ayudará a los desarrolladores a superar las limitaciones previas del sistema y ejecutar conjuntos de datos mucho más grandes. También abre la puerta a cargas de trabajo más grandes y complejas, incluida la capacitación paralela de modelado de redes neuronales. NVSwitch amplía las innovaciones disponibles a través de NVIDIA NVLink, la primera tecnología de interconexión de alta velocidad desarrollada por NVIDIA. NVSwitch permite a los diseñadores de sistemas construir sistemas aún más avanzados que puedan conectar de manera flexible cualquier topología de GPU basadas en NVLink. NVIDIA DGX-2: los dos primeros sistemas de petaflop del mundo El nuevo sistema DGX-2 de NVIDIA alcanzó el hito de dos petaflop gracias a una amplia gama de avances tecnológicos líderes en la industria desarrollados por NVIDIA en todos los niveles de la pila de computación. DGX-2 es el primer sistema para presentar NVSwitch, que permite que las 16 GPU del sistema compartan un espacio de memoria unificado. Los desarrolladores ahora tienen el poder de entrenamiento de aprendizaje profundo para abordar los conjuntos de datos más grandes y los modelos de aprendizaje profundo más complejos. Combinado con un conjunto totalmente optimizado y actualizado de software de aprendizaje profundo NVIDIA, el DGX-2 está especialmente diseñado para científicos de datos que impulsan los límites externos de la investigación y la informática de aprendizaje profundo. DGX-2 puede entrenar FAIRSeq, un modelo de traducción automática neuronal de última generación, en menos de dos días: una mejora de 10 veces en el rendimiento de la DGX-1 con Volta, presentado en septiembre.

Fuente: AnandTech


19 vistas0 comentarios

Siguenos

  • Facebook
  • Twitter
  • YouTube
  • Instagram
4 - JUbMiNh.jpg

© 2016 Derechos Reservados a Masterbitz Review