Intel presenta su propio SDK de compresión neuronal de conjuntos de texturas: texturas hasta 18 veces más pequeñas

Masterbitz
hace 20 minutos
4 Min. de lectura

En GDC 2026, la ingeniera de gráficos de Intel, Marissa Dubois, subió al escenario para presentar la versión de Intel de la compresión de la textura neuronal, muy similar al NTC de NVIDIA en que ambas tecnologías son deterministas. La presentación fue un seguimiento del prototipo original de I + D mostrado en GDC 2025, con la noticia clave de que Intel ahora ha productificado esa investigación en un SDK independiente.

Texture Set Neural Compression (TSNC) es esencialmente una forma más inteligente de almacenar texturas de juego. Los formatos tradicionales de compresión de bloques de GPU (BC1 a BC7) utilizan reglas matemáticas fijas para reducir el tamaño de la textura, y aunque son de soporte rápido y universal, dejan un potencial de compresión significativo sobre la mesa. El TSNC adopta un enfoque fundamentalmente diferente: entrena una pequeña red neuronal utilizando el descenso de gradiente estocástico para aprender a codificar y decodificar las texturas específicas en un conjunto determinado. El resultado es una representación compacta del espacio latente que un pequeño perceptrón multicapa puede reconstruir en tiempo de ejecución en el difuso original, normal, rugosidad, metales, oclusión ambiental y datos emisivos.

La idea clave es que un conjunto de texturas (todos los mapas PBR para un solo material) tiene una gran cantidad de estructura redundante a través de sus canales. TSNC explota esa estructura compartida de maneras que la compresión de bloques genéricos simplemente no puede.

Pirámides de características: Los dos niveles

En el corazón del esquema de compresión de TSNC se encuentra la pirámide característica, un conjunto de cuatro texturas de espacio latente codificadas por BC1 dispuestas en diferentes configuraciones de resolución. Intel actualmente ofrece dos variantes con diferentes compensaciones de calidad/compresión:

La variante A utiliza dos imágenes latentes de resolución completa y dos de media resolución. Para las texturas de entrada 4K, esto significa dos imágenes latentes 4K y dos 2K, que totalizan alrededor de 26.8 MB frente a los 256 MB originales de mapas de bits sin comprimir. Eso se traduce en una compresión de más de 9x, casi el doble de los 4.8x que obtendrías solo con la compresión estándar de bloques BC. La pérdida de calidad perceptual, medida a través de la herramienta de análisis FLIP de NVIDIA, se encuentra en aproximadamente el 5%, que en la práctica aparece como una pérdida de precisión menor en los mapas normales, pero poco más.
La variante B es la opción agresiva. En cascada las imágenes latentes hasta 1/2, 1/4 y 1/8 de la resolución original, logrando más de , más del doble que la variante A. El golpe de calidad, sin embargo, es más notable: los artefactos de bloque BC1 comienzan a aparecer en mapas normales y canales de AO/rugosidad, y FLIP registra un error perceptual de alrededor del 6-7%. Eso puede sonar pequeño en términos absolutos, pero Intel reconoce que es "suficiente para ser notable para un espectador". La variante B es, por lo tanto, probablemente la más adecuada para materiales distantes o secundarios donde es menos probable que se examine la pérdida de calidad.

Desde el prototipo de I + D del año pasado, originalmente construido en PyTorch, todo el compresor de compresión neuronal Texture Set ha sido reescrito desde cero utilizando sombreadores de computadora Slang. Además, ya sea que un desarrollador esté trabajando en Unreal, un motor personalizado o ejecutando la descompresión en la CPU, el mismo código de descompresor puede apuntar al backend derecho.

En el lado de la GPU, Intel ahora es compatible con la API de vectores cooperativos DirectX 12 de Microsoft, aprovechando los núcleos de matriz XMX de Intel Arc (presentes tanto en GPU de la serie A como en la serie B) para la inferencia de matriz acelerada por hardware. Para el hardware sin soporte XMX, una reserva estándar de FMA (fundida multi-y adición) funciona tanto en CPU como en GPU no Intel.

Marissa Dubois de Intel desglosó cuatro estrategias de implementación diferentes, cada una con una compensación diferente entre el ahorro de espacio en disco y el uso de memoria:

En el momento de la instalación: envíe la compresión, descomprima localmente durante la instalación. Texturas en vivo sin comprimir en la unidad del usuario. Los ahorros son principalmente en el ancho de banda de distribución.
En el momento de la carga: las texturas permanecen comprimidas en el disco; la descompresión se produce en la VRAM a medida que se carga el juego. Reduce el tamaño de la instalación y la presión de VRAM durante la carga.
En el tiempo de transmisión, combinado con la transmisión de texturas, las texturas se descomprimen bajo demanda. Lo mejor de ambos mundos para disco y memoria, pero agrega carga de inferencia de tiempo de ejecución.
En el momento de la muestra: las texturas permanecen comprimidas en VRAM permanentemente y decodifican por píxel en el sombreador. La opción más agresiva para la reducción de VRAM, con coste de inferencia constante.

Los desarrolladores tendrán que elegir uno dependiendo de su caso de uso particular y el motor subyacente.

La inferencia de Intel se refirió a una computadora portátil Panther Lake utilizando gráficos integrados B390 a una carga de trabajo completa del sombreador de computación de 1080p. Los resultados fueron:

Ruta FMA: 0.661 nanosegundos por píxel
Ruta de álgebra lineal XMX: 0.194 nanosegundos por píxel

Esa es una aceleración de 3.4x de las matemáticas de matriz aceleradas por hardware, y el hecho de que estos números se mantengan en gráficos integrados hace que el escenario de implementación de tiempo de muestra por píxel parezca más viable de lo que podría haber parecido. Para las GPU discretas, la sobrecarga sería aún menor. Intel planea lanzar una versión Alpha del SDK de compresión neuronal Texture Set a finales de este año, seguido de una versión beta y una versión pública, aunque esas fechas aún no están escritas en piedra.

Fuente: Wccftech

Intel presenta su propio SDK de compresión neuronal de conjuntos de texturas: texturas hasta 18 veces más pequeñas

Pirámides de características: Los dos niveles

Entradas recientes

Siguenos