AMD actualiza la hoja de ruta de la GPU Instinct AI, anuncia MI350X CDNA 4 y 1 año de Cadence
En Computex 2024, AMD mostró el creciente impulso de la familia de aceleradores AMD Instinct durante el discurso inaugural de la presidenta y consejera delegada, la Dra. Lisa Su. AMD desveló una hoja de ruta de aceleradores AMD Instinct ampliada y plurianual que aportará una cadencia anual de liderazgo en rendimiento de IA y capacidades de memoria en cada generación.
La hoja de ruta actualizada comienza con el nuevo acelerador AMD Instinct MI325X, que estará disponible en el cuarto trimestre de 2024. A continuación, se espera que la serie AMD Instinct MI350, impulsada por la nueva arquitectura AMD CDNA 4, esté disponible en 2025 aportando un aumento de hasta 35 veces en el rendimiento de inferencia de IA en comparación con la serie AMD Instinct MI300 con arquitectura AMD CDNA 3. La serie AMD Instinct MI400, cuya llegada está prevista para 2026, se basa en la arquitectura AMD CDNA «Next».
«Los aceleradores AMD Instinct MI300X continúan su fuerte adopción por parte de numerosos socios y clientes, incluyendo Microsoft Azure, Meta, Dell Technologies, HPE, Lenovo y otros, un resultado directo del excepcional rendimiento y propuesta de valor del acelerador AMD Instinct MI300X», dijo Brad McCredie, vicepresidente corporativo de Data Center Accelerated Compute de AMD. «Con nuestra cadencia anual actualizada de productos, somos implacables en nuestro ritmo de innovación, proporcionando las capacidades de liderazgo y el rendimiento que la industria de la IA y nuestros clientes esperan para impulsar la próxima evolución del entrenamiento y la inferencia de IA en el centro de datos.»
El ecosistema de software de IA de AMD madura
La pila de software abierto AMD ROCm 6 continúa madurando, permitiendo a los aceleradores AMD Instinct MI300X impulsar un rendimiento impresionante para algunos de los LLM más populares. En un servidor que utiliza ocho aceleradores AMD Instinct MI300X y ROCm 6 ejecutando Meta Llama-3 70B, los clientes pueden obtener un rendimiento de inferencia y generación de tokens 1,3 veces superior al de la competencia. En un único acelerador AMD Instinct MI300X con ROCm 6, los clientes pueden obtener un rendimiento de inferencia y generación de tokens 1,2 veces mejor que la competencia en Mistral-7B3. AMD también ha destacado que Hugging Face, el mayor y más popular repositorio de modelos de inteligencia artificial, está probando 700.000 de sus modelos más populares cada noche para garantizar su funcionamiento inmediato en los aceleradores AMD Instinct MI300X. Además, AMD sigue trabajando en marcos de trabajo de IA populares como PyTorch, TensorFlow y JAX.
AMD presenta nuevos aceleradores y revela la hoja de ruta anual de Cadence
Durante la keynote, AMD reveló una cadencia anual actualizada para la hoja de ruta del acelerador AMD Instinct para satisfacer la creciente demanda de más computación de IA. Esto ayudará a garantizar que los aceleradores AMD Instinct impulsen el desarrollo de modelos de IA de vanguardia de próxima generación. La hoja de ruta anual actualizada de AMD Instinct destaca:
El nuevo acelerador AMD Instinct MI325X, que aportará 288 GB de memoria HBM3E y 6 terabytes por segundo de ancho de banda de memoria, utilizará el mismo diseño de servidor de placa base universal estándar del sector utilizado por la serie AMD Instinct MI300, y estará disponible de forma general en el cuarto trimestre de 2024. El acelerador tendrá una capacidad de memoria y un ancho de banda líderes en el sector, 2 veces y 1,3 veces mejores que los de la competencia respectivamente, y un rendimiento de cálculo 1,3 veces superior al de la competencia.
El primer producto de la serie AMD Instinct MI350, el acelerador AMD Instinct MI350X, se basa en la arquitectura AMD CDNA 4 y se espera que esté disponible en 2025. Utilizará el mismo diseño de servidor de placa base universal estándar del sector que otros aceleradores de la serie MI300 y se fabricará con la avanzada tecnología de proceso de 3 nm, será compatible con los tipos de datos de IA FP4 y FP6 y tendrá hasta 288 GB de memoria HBM3E.
Se espera que la arquitectura AMD CDNA «Next», que impulsará los aceleradores AMD Instinct Serie MI400, esté disponible en 2026, proporcionando las últimas características y capacidades que ayudarán a desbloquear un rendimiento y eficiencia adicionales para la inferencia y el entrenamiento de IA a gran escala.
Por último, AMD destacó que la demanda de aceleradores AMD Instinct MI300X sigue creciendo con numerosos socios y clientes que utilizan los aceleradores para potenciar sus exigentes cargas de trabajo de IA, incluyendo:
Microsoft Azure utiliza los aceleradores para los servicios Azure OpenAI y las nuevas máquinas virtuales Azure ND MI300X V5.
Dell Technologies utiliza aceleradores MI300X en el PowerEdge XE9680 para cargas de trabajo de IA empresarial.
Supermicro proporciona múltiples soluciones con aceleradores AMD Instinct.
Lenovo impulsa la innovación de la IA híbrida con el ThinkSystem SR685a V3.
HPE los utiliza para acelerar las cargas de trabajo de IA en el HPE Cray XD675.
Comentários