IA agente

Tu fábrica de IA necesita una infraestructura que realmente funcione

La mayoría de las plataformas de IA prometen IA a gran escala, pero ofrecen complejidad. Nutanix Agentic AI es una solución de software full-stack que proporciona un modelo operativo en la nube para ayudar a las organizaciones a construir, operar y gobernar fábricas de IA. Gracias a las integraciones con el ecosistema de computación acelerada de NVIDIA, la solución simplifica las operaciones, maximiza el rendimiento y la seguridad, y optimiza la utilización de la GPU y los costes de los tokens.

Un modelo operativo en la nube para fábricas de IA

Nutanix ofrece un modelo operativo en la nube diseñado específicamente para la era de los compañeros de IA que funcionan en fábricas de IA. Al abstraer la complejidad y ayudar a los responsables de la toma de decisiones de TI a equilibrar rendimiento, seguridad y coste, la solución de IA Agentic de Nutanix hace mucho más que simplificar las operaciones; optimiza fundamentalmente la economía de la IA.

Gráfico de Minimizar el coste por token

Minimizar el coste por token

La solución full-stack ofrece enrutamiento inteligente, escalado de inferencia, colocación de recursos consciente de la topología y un consumo optimizado de GPU para reducir los costes por token.

Gráfico de Seguridad Empresarial

Garantizar la seguridad y el control de nivel empresarial

Nutanix Enterprise AI proporciona un despliegue seguro y controles empresariales para tus endpoints LLM, mientras que las mejoras en Nutanix AHV (virtualización) y Nutanix Flow (redes y seguridad) garantizan un aislamiento y seguridad superiores.

Desarrollador: Velocity Graphic

Velocidad de desarrollo de aceleración

Pasar del concepto a la producción sin retrasos en la infraestructura. Nutanix Enterprise AI facilita la integración de herramientas de IA al ofrecer enrutamiento inteligente de modelos y endpoints de inferencia segura en un solo clic, así como acceso seguro y llave en mano a servidores Model Context Protocol. La plataforma Nutanix Kubernetes ofrece un entorno de inicio rápido con un amplio catálogo de servicios de IA y acceso integrado a datos privados para desarrolladores de aplicaciones de IA Agentic.

Operacionalizar el gráfico de IA agente

Operacionalización total de la IA agente

La solución de IA Nutanix Agentic está diseñada específicamente para integrarse de forma fluida y complementar las fábricas de IA certificadas por NVIDIA, aprovechando relaciones profundas con socios para ofrecer soluciones completas de los principales fabricantes de hardware OEM, incluyendo Cisco, Dell y Supermicro.

Diagrama de soluciones NVIDIA

Componentes Integrados Clave

Servicios de IA y plataforma Kubernetes

Este entorno centrado en el desarrollador y nativo en la nube permite a los equipos saltarse la configuración de infraestructura y escalar inmediatamente aplicaciones de IA Agentic de grado de producción con una economía de tokens predecible.

Optimización de infraestructuras y seguridad

Orquesta el poder de la computación acelerada a través de un factor de forma de máquina virtual, ofreciendo el máximo rendimiento y seguridad para lograr un menor coste por token.

Servicios de Datos Fundamentales para IA

Proporciona la estructura de datos de alto rendimiento necesaria para conectar el entrenamiento y la inferencia mediante una transformación continua acelerada por GPU directamente dentro del clúster de almacenamiento.

Servicios de IA y plataforma Kubernetes

Persona usando la consola

Gateway avanzado de IA y servicios de inferencia

Un endpoint de inferencia unificado y seguro permite a las empresas usar modelos alojados en la nube (y créditos de tokens) junto con LLMs privados con autenticación, observabilidad y limitación de tasa basada en tokens consistentes.

Soporte y ajuste fino de protocolos de contexto de modelo

Nutanix Enterprise AI amplía sus robustas capacidades actuales de Model-as-a-Service (MaaS) para permitir que los agentes se conecten de forma segura con herramientas y fuentes de datos empresariales.

Plataforma Open Kubernetes con catálogo rico de IA

Trasladar aplicaciones Agentic desde el concepto hasta la producción sin retrasos en la infraestructura utilizando un catálogo prevalidado de servicios de IA de código abierto, incluyendo cuadernos, bases de datos vectoriales y motores MLOps. La solución está integrada de forma nativa con NVIDIA AI Enterprise para permitir a los desarrolladores desplegar instantáneamente las NIMs NVIDIA, incluido Nemotron, para acelerar el desarrollo de aplicaciones de IA de alto rendimiento en producción.

Optimización de infraestructuras y seguridad

Luces de la ciudad por la noche

Optimización consciente de la topología

El hipervisor AHV de Nutanix garantiza una alineación estricta del hardware sin la complejidad de la configuración manual de la infraestructura para maximizar el rendimiento, la seguridad y la utilización de recursos, optimizando automáticamente la colocación de cargas de trabajo en servidores con densidad GPU.

Redes de Confianza Cero Aceleradas por DPU

Aprovechar Nutanix Flow con nuevas capacidades de descarga de DPU ofrece la velocidad bruta del bare metal con el sofisticado aislamiento de un entorno virtualizado con una base de red de alto rendimiento y confianza cero, que maximiza el rendimiento y garantiza el flujo seguro y fiable de datos a través de la fábrica de IA.

Gestión del ciclo de vida con aire separado

La solución soporta instalaciones totalmente desconectadas de toda la plataforma NKP y de la GPU y los operadores de red NVIDIA, permitiendo que entornos altamente regulados o del sector de defensa automatizen actualizaciones de controladores y optimización de red sin exponer el clúster a internet.

Servicios de Datos Fundamentales para IA

Gráfico genérico de luces

Escalabilidad lineal

Como plataforma de datos de IA certificada por NVIDIA-Enterprise, Nutanix Unified Storage ofrece un rendimiento de lectura/escritura de alta velocidad en miles de clientes GPU, asegurando que la disponibilidad de datos escale tan rápido como tu cálculo.

Rendimiento avanzado

Garantiza que las GPUs nunca estén "privadas" de datos aprovechando NFS sobre RDMA y pronto S3 sobre RDMA para proporcionar un camino de datos de baja latencia.

Optimización de costes

Reduce el coste agregado por token y libera memoria crítica de la GPU al proporcionar un nivel de alta capacidad para la descarga de la caché KV, permitiendo procesar ventanas de contexto significativamente mayores y más usuarios concurrentes sin una penalización de rendimiento.

Confían en Nutanix


Obtenga su 'Test Drive'

Ejecuta interferencias de IA a gran escala con Nutanix Enterprise AI

¿Listo para una demostración?

Hable con un experto sobre cómo Nutanix le permite ampliar la IA en entornos multicloud híbridos.

Preguntas frecuentes

La solución de IA Agentic de Nutanix abstrae la complejidad y crea un puente fluido entre los constructores de IA agentica y los operadores de fábricas de IA. Esta solución full-stack ofrece un modelo operativo en la nube para los operadores de fábricas de IA al simplificar las operaciones, maximizar el rendimiento y la seguridad, y optimizar los costes de los tokens. Al mismo tiempo, permite a los desarrolladores de IA agente centrarse en la innovación, la gestión de modelos y la rápida escalada de inferencias.

Los desarrolladores de IA agente se enfrentan a un alto grado de "fricción con la innovación" al navegar por un panorama fragmentado de modelos, herramientas y silos de datos en lugar de centrarse en construir inteligencia. Los desarrolladores carecen de una vía unificada y segura para aprovechar la diversidad de LLMs y herramientas de código abierto para acceder a aplicaciones que evolucionan rápidamente, desde simples interfaces de chat hasta sofisticadas IA agentes capaces de generar resultados empresariales reales.

Para los operadores de fábricas de IA, el mayor desafío es ofrecer valor empresarial medido en términos de tiempo para los tokens y coste por token debido a la complejidad operativa en fábricas de IA como: 

  • Complejidad en la gestión de hardware de IA diverso y en rápida evolución (GPUs, redes, almacenamiento), 
  • Complejidad de proporcionar acceso compartido a infraestructuras críticas de IA asegurando al mismo tiempo un acceso seguro al modelo y los datos, y cumpliendo con los requisitos de soberanía
  • Complejidad de ofrecer consistentemente el máximo rendimiento, optimizando la utilización de recursos en toda la fábrica de IA.
  • Complejidad de gestionar el ciclo de vida de soluciones puntuales fragmentadas y a medida que apoyan las operaciones de fábricas de IA

El Modelo Operativo en la Nube es el enfoque de Nutanix para tender puentes entre los desarrolladores de IA y los equipos de infraestructura. En lugar de gestionar soluciones puntuales fragmentadas o clústeres complejos de metal desnudo, este modelo proporciona un entorno unificado y full-stack. Permite a los operadores gobernar infraestructuras de IA (GPUs, DPUs y almacenamiento) con la misma facilidad que un servicio en la nube, mientras proporciona a los desarrolladores acceso instantáneo y seguro a las herramientas y modelos que necesitan para escalar miles de agentes inteligentes.

Nutanix optimiza la economía de los tokens mediante varias eficiencias integradas:

  • Optimización consciente de la topología: El hipervisor AHV coloca automáticamente las cargas de trabajo entre servidores con densidad de GPU para maximizar la alineación del hardware.
  • Descarga de recursos: Utilizar DPUs (Unidades de Procesamiento de Datos) para gestionar tareas de red y seguridad libera ciclos de GPU específicamente para la inferencia.
  • Almacenamiento inteligente: Nutanix Unified Storage proporciona un nivel de alta capacidad para la descarga de la caché KV, lo que ahorra costosa memoria GPU y permite ventanas de contexto más largas sin penalización en el rendimiento.

Aunque el bare-metal era el estándar para el entrenamiento inicial del modelo, a menudo carece de la seguridad y aislamiento necesarios para escalar agentes en una empresa. Nutanix utiliza infraestructura Kubernetes basada en máquinas virtuales para proporcionar:

  • Aislamiento superior: Límites de multitenencia y seguridad más sólidos entre diferentes cargas de trabajo de IA.
  • Gestión a escala: Gestión del ciclo de vida y asignación de recursos más sencilla.
  • Rendimiento en bare-metal: Aprovechando la aceleración de DPU y la conciencia topológica, Nutanix ofrece la velocidad del bare metal con la gobernanza de un entorno virtualizado.

La pasarela NAI actúa como una "puerta principal" segura para todos los modelos de IA. Proporciona un endpoint de inferencia unificado que permite a las empresas gestionar modelos alojados en la nube y LLMs privados en un solo lugar. Las características clave incluyen:

  • Gobernanza: Limitación de tasas basada en tokens para evitar el "bill shock".
  • Observabilidad: Visibilidad total sobre quién consume recursos y cómo.
  • Conectividad: Soporte para el Protocolo de Contexto de Modelo (MCP), que permite a los agentes conectarse de forma segura a datos y herramientas privadas de empresas.

La solución reduce la "fricción de innovación" al proporcionar un entorno centrado en los desarrolladores donde pueden evitar la configuración de infraestructuras. A través de la Plataforma Kubernetes Nutanix (NKP), los constructores acceden a un rico catálogo de IA que incluye:

  • Herramientas de código abierto preconstruidas (Notebooks, bases de datos vectoriales, motores MLOps).
  • Despliegue instantáneo de las NIMs NVIDIA y la familia de modelos NVIDIA Nemotron .
  • Endpoints de inferencia seguros de un solo clic y acceso llave en mano a servicios de ajuste fino.

Nutanix Unified Storage ofrece una plataforma de datos escalable y de alto rendimiento, diseñada específicamente para cargas de trabajo modernas como IA y aplicaciones de próxima generación. Las capacidades clave incluyen:

  • Rendimiento de lectura ultrarrápido y capacidad densa de NVMe para manejar enormes conjuntos de datos para pipelines de IA, incluyendo Inferencia y Generación Aumentada por Recuperación (RAG).
  • Integración con la plataforma Nutanix Kubernetes, que permite el despliegue fluido de canales de IA/ML contenedores y aplicaciones nativas en la nube.
  • Acceso a datos multiprotocolo, simplificando el almacenamiento para cargas de trabajo diversas y acelerando la innovación.