• Masterbitz

NVIDIA RTX IO detallado: la pila de almacenamiento asistida por GPU está aquí para quedarse

NVIDIA en su evento de lanzamiento GeForce "Ampere" anunció la tecnología RTX IO. El almacenamiento es el eslabón más débil de una computadora moderna, desde el punto de vista del rendimiento, y los SSD han tenido un impacto transformador. Con los SSD modernos que aprovechan PCIe, las velocidades de almacenamiento del consumidor ahora están destinadas a crecer con cada nueva generación de PCIe duplicando el ancho de banda de E / S por carril. PCI-Express Gen 4 permite un ancho de banda de 64 Gbps por dirección en SSD M.2 NVMe, AMD ya lo ha implementado en su plataforma de escritorio Ryzen, Intel lo tiene en sus últimas plataformas móviles y se espera que lo lleve a su plataforma de escritorio con " Rocket Lake ". Si bien siempre es bienvenido más ancho de banda de almacenamiento, la pila de procesamiento de almacenamiento (la tarea de procesar unos y ceros en la capa física), aún la maneja la CPU. Con el aumento del ancho de banda de almacenamiento, la carga de E / S en la CPU aumenta proporcionalmente, hasta un punto en el que puede comenzar a afectar el rendimiento. Microsoft buscó abordar este desafío emergente con la API de DirectStorage, pero NVIDIA quiere aprovechar esto.



Según las pruebas de NVIDIA, la lectura de datos sin comprimir de un SSD a 7 GB / s (velocidades máximas típicas de lectura secuencial de los SSD PCIe Gen 4 M.2 NVMe del segmento de cliente) requiere la utilización completa de dos núcleos de CPU. El sistema operativo normalmente distribuye esta carga de trabajo entre todos los núcleos / subprocesos de CPU disponibles en una CPU moderna de varios núcleos. Las cosas cambian drásticamente cuando se leen datos comprimidos (como los recursos del juego), en un escenario de juego, con una gran cantidad de solicitudes de E / S. Los juegos AAA modernos tienen cientos de miles de recursos individuales en archivos comprimidos de paquetes de recursos.


Aunque a nivel de E / S de disco, los unos y los ceros todavía se mueven hasta 7 GB / s, el flujo de datos descomprimido a nivel de CPU puede llegar a 14 GB / s (en el mejor de los casos, compresión). Agregue a esto, cada solicitud de E / S viene con su propia sobrecarga: un conjunto de instrucciones para que la CPU obtenga x pieza de recurso del archivo y y la envíe al búfer z, junto con instrucciones para descomprimir o descifrar el recurso. Esto podría requerir una enorme cantidad de CPU a una alta escala de rendimiento de E / S, y NVIDIA fija la cantidad de núcleos de CPU necesarios hasta 24. Como explicamos anteriormente, DirectStorage permite una ruta para que los dispositivos procesen directamente la pila de almacenamiento para acceder a recursos que necesitan. La API de Microsoft se desarrolló originalmente para Xbox Series X, pero está haciendo su debut en la plataforma de PC.


NVIDIA RTX IO es una capa exterior concéntrica de DirectStorage, que está optimizada aún más para juegos y la arquitectura de GPU de NVIDIA. RTX IO trae a la mesa la descompresión de datos sin pérdidas acelerada por GPU, lo que significa que los datos permanecen comprimidos y agrupados con menos encabezados IO, mientras se mueven del disco a la GPU, aprovechando DirectStorage. NVIDIA afirma que esto mejora el rendimiento de IO en un factor de 2. NVIDIA afirma además que las GPU GeForce RTX, gracias a sus altos recuentos de núcleos CUDA, son capaces de descargar "docenas" de núcleos de CPU, impulsando el rendimiento de descompresión incluso más allá de los datos comprimidos que cargan PCIe. Los SSD Gen 4 pueden lanzarles.


Sin embargo, hay una pequeña arruga. Los juegos deben optimizarse para DirectStorage. Dado que la API ya se ha implementado en Xbox desde la Xbox Series X, la mayoría de los juegos AAA para Xbox que tienen versiones para PC ya tienen algo de conocimiento sobre la tecnología, sin embargo, las versiones para PC deberán ser parcheadas para usar la tecnología. Los juegos también necesitarán conocimiento de NVIDIA RTX IO, y NVIDIA necesita agregar soporte por juego a través de actualizaciones de controladores GeForce. NVIDIA no detalló qué GPU admitirán la tecnología, pero dada su redacción y el uso de "RTX" en la marca de la función, NVIDIA podría lanzar la función a la serie RTX 20 "Turing" y la serie RTX 30 " Amperio." La serie GTX 16 probablemente se pierda, ya que lo que NVIDIA espera lograr con RTX IO probablemente sea demasiado pesado en la serie 16, y esto puede haber sido una decisión puramente basada en el impacto del rendimiento para NVIDIA.

2 vistas

Siguenos

  • Facebook
  • Twitter
  • YouTube
  • Instagram

© 2016 Derechos Reservados a Masterbitz Review