top of page
IG.png

IBM Cloud es el primer proveedor de servicios en desplegar Intel Gaudi 3

  • Foto del escritor: Masterbitz
    Masterbitz
  • 2 may
  • 4 Min. de lectura

IBM es el primer proveedor de servicios en la nube en poner a disposición de los clientes los aceleradores de IA Intel Gaudi 3, una medida diseñada para hacer más accesibles las potentes capacidades de inteligencia artificial y para abordar directamente el alto coste del hardware especializado en IA. Para Intel, el despliegue en IBM Cloud marca el primer gran despliegue comercial de Gaudi 3, aportando opciones al mercado. Al aprovechar Intel Gaudi 3 en IBM Cloud, las dos empresas pretenden ayudar a los clientes a probar, innovar y desplegar soluciones GenAI de forma rentable.



Según una previsión reciente de la firma de investigación Gartner, se espera que el gasto mundial en IA generativa (GenAI) alcance los 644.000 millones de dólares en 2025, un aumento del 76,4% desde 2024. La investigación encontró que "GenAI tendrá un impacto transformador en todos los aspectos de los mercados de gasto en TI, lo que sugiere un futuro en el que las tecnologías de IA se volverán cada vez más integrales en las operaciones comerciales y los productos de consumo."


Para muchos clientes empresariales, los beneficios son evidentes cuando herramientas como GenAI automatizan tareas, mejoran los flujos de trabajo e impulsan la innovación. Pero el despliegue de aplicaciones de IA exige una potencia de cálculo significativa, que a menudo requiere costosos procesadores especializados que pueden impedir que muchas empresas se beneficien de la IA.


Los aceleradores de IA Gaudi 3 están diseñados específicamente para ayudar a satisfacer la creciente demanda de GenAI, la inferencia de modelos de gran tamaño y el ajuste fino de modelos, al tiempo que admiten un marco de desarrollo abierto. Gaudi 3 también es ideal para grandes modelos de lenguaje multimodal (LLM) y generación aumentada por recuperación (RAG).


"Al llevar los aceleradores Intel Gaudi 3 AI a IBM Cloud, estamos permitiendo a las empresas ayudar a escalar las cargas de trabajo de IA generativa con un rendimiento optimizado para la inferencia y el ajuste fino", dijo Saurabh Kulkarni, vicepresidente de Data Center AI Strategy en Intel. "Esta colaboración subraya nuestro compromiso compartido de hacer que la IA sea más accesible y rentable para las empresas de todo el mundo."


Cómo utilizan IBM Cloud los clientes empresariales

IBM Cloud da servicio a una amplia gama de clientes empresariales, en particular a los de sectores regulados, como los servicios financieros, la sanidad y las ciencias de la vida, y el sector público.


Los bancos y las compañías de seguros utilizan la nube para la detección de fraudes o el servicio personalizado de atención al cliente, mientras que los proveedores de atención sanitaria la utilizan para acelerar el descubrimiento y desarrollo de fármacos, el diagnóstico impulsado por IA, las plataformas de telemedicina y la monitorización de pacientes en tiempo real. Los minoristas utilizan la tecnología en la nube para plataformas de comercio electrónico o gestión de inventarios. También es una opción para las empresas que buscan modernizar sistemas antiguos sin renunciar al control o la seguridad.


Gaudi 3 ya está disponible en las regiones IBM Cloud de Frankfurt, Alemania; Washington, D.C.; y Dallas, Texas.


Gaudí 3 también se está integrando en las ofertas más amplias de infraestructura de IA de IBM. Los clientes ya pueden utilizar Gaudí 3 a través de IBM Cloud Virtual Servers en IBM Virtual Private Cloud (VPC). Los clientes también podrán desplegar a través de arquitecturas a partir de la segunda mitad de 2025. Se espera que el soporte para Red Hat OpenShift y la plataforma watsonx AI de IBM esté disponible este trimestre.


"La capacidad de manejar más datos, y tener un mayor rendimiento, todo esto va a impulsar una mejor adopción de la IA para los clientes de todo el mundo", dice Satinder Sethi, director general de IBM Cloud Infrastructure Services. "Intel Gaudi 3 está dando a los clientes más opciones, más libertad y una plataforma más rentable de qué hardware de IA quieren usar."


Comparaciones de coste y rendimiento

Los aceleradores de IA Intel Gaudi 3 están diseñados para afrontar el reto del coste equilibrando rendimiento y precio. Las nuevas pruebas de referencia de inferencia de IA realizadas por la empresa de investigación Signal65, y encargadas por Intel, descubrieron que Gaudi 3 es un 92% más rentable (rendimiento por dólar) que la competencia cuando se ejecuta en el modelo Llama-3.1-405B-Instruct-FP8 de Meta con grandes tamaños de contexto.


La eficiencia de costes es una métrica crucial porque permite a las empresas realizar más procesamiento de IA con la misma inversión o la misma cantidad de procesamiento a un coste menor. Los aumentos de rendimiento pretenden reducir la barrera del coste para las empresas que buscan desplegar o ajustar modelos, especialmente a medida que se extiende la adopción de GenAI.


Las medidas de rendimiento se refieren a la cantidad de procesamiento de IA que el acelerador puede realizar en cada tiempo, también conocido como tokens por segundo. Gaudi 3 ofrece un procesamiento de IA significativamente más rápido que la competencia. En el modelo IBM Granite-3.1-8B-Instruct, Gaudí 3 proporcionó un 43% más de tokens por segundo para cargas de trabajo de IA pequeñas, y un 36% más de tokens por segundo con tamaños de contexto grandes en comparación con la competencia al ejecutar el modelo Llama-3.1-405B-Instruct-FP8 de Meta.


Fuente: Intel

Commentaires


Aplus_MARS_2107_Eng(1).png
undefined - Imgur(1).jpg

Siguenos

  • Facebook
  • Twitter
  • YouTube
  • Instagram
gaming

© 2016 Derechos Reservados a MasterbitzReviewHN

bottom of page