NVIDIA llevará el razonamiento de inteligencia artificial a las empresas con Google Cloud
- Masterbitz

- 9 abr 2025
- 3 Min. de lectura
NVIDIA colabora con Google Cloud para traer de IA agenteic a empresas que buscan aprovechar localmente la familia Google Gemini de modelos de IA utilizando las plataformas NVIDIA Blackwell HGX y DGX y Computación confidencial NVIDIA para la seguridad de los datos. Con el NVIDIA Blackwell plataforma en Google Distributed Cloud, los centros de datos en las instalaciones pueden mantenerse alineados con los requisitos regulatorios y las leyes de soberanía de datos bloqueando el acceso a información sensible, como registros de pacientes, transacciones financieras e información oficial del gobierno. NVIDIA Confidential Computing también asegura el código sensible en los modelos Gemini de acceso no autorizado y filtraciones de datos.
"Al llevar nuestros modelos de Gémini a las instalaciones con el rendimiento innovador y las capacidades de computación confidenciales de NVIDIA Blackwell, estamos permitiendo a las empresas desbloquear todo el potencial de la IA agente", dijo Sachin Gupta, vicepresidente y director general de infraestructura y soluciones de Google Cloud. "Esta colaboración ayuda a garantizar que los clientes puedan innovar de forma segura sin comprometer el rendimiento o la facilidad operativa". La computación confidencial con NVIDIA Blackwell ofrece a las empresas la garantía técnica de que su usuario informa a la interfaz de programación de aplicaciones de los modelos Gemini, así como los datos que utilizaron para afinar-ampliar-permanecer seguro y no puede ser visto o modificado. Al mismo tiempo, los propietarios de modelos pueden protegerse contra el acceso o la manipulación no autorizada, proporcionando protección de doble capa que permite a las empresas innovar con modelos Gemini manteniendo al mismo tiempo la privacidad de los datos.
Agentes de AI que conducen nuevas aplicaciones empresariales
Esta nueva oferta llega como agente AI está transformando la tecnología empresarial, ofreciendo capacidades más avanzadas de resolución de problemas. A diferencia de los modelos de IA que perciben o generan basados en el conocimiento aprendido, los sistemas de IA agentes pueden razonar, adaptarse y tomar decisiones en entornos dinámicos. Por ejemplo, en soporte de TI empresarial, mientras que un modelo de IA basado en el conocimiento puede recuperar y presentar guías de resolución de problemas, un sistema de IA agente puede diagnosticar problemas, ejecutar correcciones y aumentar los problemas complejos de manera autónoma.
Del mismo modo, en las finanzas, un modelo tradicional de IA podría marcar transacciones potencialmente fraudulentas basadas en patrones, pero un sistema de IA agente puede ir aún más lejos investigando anomalías y tomando medidas proactivas como bloquear transacciones antes de que ocurran o ajustar las normas de detección de fraude en tiempo real.
El Dilema de los Enmisos
Mientras que muchos ya pueden utilizar los modelos con razonamiento multimodal.integrando texto, imágenes, código y otros tipos de datos para resolver problemas complejos y construir aplicaciones de IA agente basadas en la nube, aquellos con estrictos requisitos de seguridad o soberanía de datos aún no han podido hacerlo. Con este anuncio, Google Cloud será uno de los primeros proveedores de servicios en la nube en ofrecer capacidades de computación confidenciales para asegurar cargas de trabajo de IA agentes en todo el entorno, ya sea en la nube o híbrida.

Impulsada por la plataforma NVIDIA HGX B200 con GPUs de Blackwell y NVIDIA Confiential Computing, esta solución permitirá a los clientes salvaguardar los modelos y datos de IA. Esto permite a los usuarios lograr un rendimiento y una eficiencia energética innovadores sin comprometer la seguridad de los datos o la integridad del modelo.
AI Observabilidad y seguridad para la IA Génetica
La IA agente de escalada en la producción requiere una vigilancia y seguridad sólidas para garantizar un rendimiento y un cumplimiento confiables. Google Cloud anunció hoy un nuevo GKE Inference Gateway construido para optimizar el despliegue de las cargas de trabajo de inferencia de IA con enrutamiento avanzado y escalabilidad. Integrando con NVIDIA Triton Inference Server y NVIDIA NeMo Guardrails, ofrece un equilibrio de carga inteligente que mejora el rendimiento y reduce los costos de servicio al tiempo que permite la seguridad y la gobernanza del modelo centralizado.

De cara al futuro, Google Cloud está trabajando para mejorar la observabilidad para las cargas de trabajo de IA agentes mediante la integración Dínamo NVIDIA, una biblioteca de código abierto construida para servir y escalar modelos de IA en todas las fábricas de IA.












.png)



Comentarios