top of page
IG.png

La APU de cálculo en memoria alcanza un rendimiento de IA de clase GPU con una fracción del coste energético.

  • Foto del escritor: Masterbitz
    Masterbitz
  • 20 oct
  • 3 Min. de lectura

GSI Technology, Inc. (Nasdaq: GSIT), el inventor de la Unidad de Procesamiento Asociado (APU), un cambio de paradigma en el procesamiento de inteligencia artificial (IA) y computación de alto rendimiento (HPC) que proporciona la verdadera tecnología de computación en memoria, anunció la publicación de un artículo dirigido por investigadores de la Universidad de Cornell. Los hallazgos confirmaron que las arquitecturas APU CIM (Compute-In-Memory) de GSI Technology pueden igualar el rendimiento a nivel de GPU para aplicaciones de inteligencia artificial a gran escala con una reducción dramática en el consumo de energía debido a la memoria de alta densidad y alto ancho de banda asociada con la arquitectura CIM.

Los principales hallazgos incluyen:

  • Rendimiento de clase GPU: la GPU Gemini-I entregó un rendimiento comparable a la GPU A6000 de NVIDIA en las cargas de trabajo de RAG.

  • Ventaja energética masiva: la APU ofrece un consumo de energía más del 98% menor que una GPU en varios conjuntos de datos de grandes corporaciones, lo que subraya su eficiencia y sostenibilidad.

  • Más rápido y más eficiente que las CPU: el diseño único de la APU le permite realizar tareas de recuperación varias veces más rápido que las CPU estándar, lo que reduce el tiempo total de procesamiento hasta en un 80%.

   

"La validación independiente de Cornell confirma lo que hemos creído durante mucho tiempo: la computación en memoria tiene el potencial de interrumpir el mercado de inferencia de IA de $ 100 mil millones", dijo Lee-Lean Shu, presidente y director ejecutivo de GSI Technology. "La APU ofrece un rendimiento de clase GPU a una fracción del costo de energía, gracias a su arquitectura altamente eficiente centrada en la memoria".


Publicado en ACM y presentado en la conferencia Micro '25, el documento del equipo de investigación de Cornell titulado "Caracterización y optimización de cargas de trabajo realistas en un dispositivo de computación comercial en SRAM", representa una de las primeras evaluaciones exhaustivas de un dispositivo comercial de computación en memoria bajo cargas de trabajo realistas. El equipo dirigido por Cornell hizo un benchmark en el GSI Gemini-I APU contra CPUs y GPU establecidas, centrándose en tareas de generación aumentada de recuperación (RAG) sobre conjuntos de datos que van desde 10 GB a 200 GB.


Los hallazgos de los investigadores apuntan a oportunidades significativas para la tecnología GSI a medida que los clientes requieren cada vez más ganancias de rendimiento por vatio en varias industrias, incluida Edge AI para robótica, drones y dispositivos IoT con límite de energía, así como aplicaciones de defensa y aeroespaciales donde la APU puede ofrecer un alto rendimiento en entornos con estrictas restricciones de energía y enfriamiento.


El Sr. Shu continuó: "Este tremendo trabajo de Cornell destaca las ventajas de CIM utilizando el silicio Gemini-I. Nuestro silicio APU de segunda generación recientemente lanzado, Gemini-II, puede ofrecer aproximadamente 10x un rendimiento más rápido y aún más latencia para cargas de trabajo de IA de memoria intensiva, al tiempo que mejora aún más la eficiencia energética. Mirando hacia el futuro, Plato representa el siguiente paso adelante, ofreciendo una capacidad de cálculo aún mayor a menor potencia para aplicaciones de borde integradas. La combinación única de velocidad, eficiencia y programabilidad de la APU nos posiciona para desbloquear oportunidades de alto crecimiento en inteligencia artificial de borde, centros de datos, defensa y otros mercados donde la eficiencia energética es una ventaja estratégica crítica".


El estudio de Cornell también introdujo un nuevo marco analítico para dispositivos de computación en memoria de propósito general, que proporciona principios de optimización que fortalecen la posición de la APU como una plataforma escalable para desarrolladores e integradores de sistemas. Una copia de la publicación se puede encontrar en el sitio web de GSI en gsitechnology.com/caracterizing-and-optimizing-realistic-workloads-on-a-commercial-compute-in-sram-device/. .


Comentarios


Aplus_MARS_2107_Eng(1).png
undefined - Imgur(1).jpg

Siguenos

  • Facebook
  • Twitter
  • YouTube
  • Instagram
gaming

© 2016 Derechos Reservados a MasterbitzReviewHN

bottom of page