AI agentica

La tua AI factory ha bisogno di un'infrastruttura affidabile

La maggior parte delle piattaforme AI promettono AI su larga scala, ma comportano complessità. Nutanix Agentic AI è una soluzione software full-stack che fornisce un modello operativo cloud per aiutare le organizzazioni a costruire, gestire e governare fabbriche di AI. Attraverso le integrazioni con l'ecosistema di computing accelerato NVIDIA, la soluzione semplifica le operazioni, massimizza le prestazioni e la sicurezza e ottimizza l'utilizzo delle GPU e i costi dei token.

Un modello operativo cloud per le AI factory

Nutanix offre un modello operativo cloud progettato specificamente per l'era dei collaboratori AI che operano nelle AI factory. Astraendo la complessità e aiutando i responsabili IT a bilanciare prestazioni, sicurezza e costi, la soluzione Nutanix Agentic AI non solo semplifica le operazioni, ma ottimizza gli aspetti economici dell'AI.

Grafico della riduzione del costo per token

Riduci al minimo il costo per token

La soluzione full-stack offre routing, scaling delle inferenze, posizionamento delle risorse consapevole della topologia intelligenti e un consumo ottimizzato della GPU per ridurre i costi per token.

Grafico di sicurezza aziendale

Garantisci sicurezza e controllo di livello enterprise

Nutanix Enterprise AI offre implementazione sicura e controlli di livello enterprise per gli endpoint LLM, mentre i miglioramenti a Nutanix AHV (virtualizzazione) e Nutanix Flow (rete e sicurezza) garantiscono isolamento e sicurezza superiori.

Grafico della velocità degli sviluppatori

Aumenta la produttività degli sviluppatori

Passa dal concept alla produzione senza ritardi infrastrutturali. Nutanix Enterprise AI semplifica gli strumenti AI offrendo routing intelligente dei modelli, endpoint di inferenza sicuri 1-click e accesso sicuro e pronto all'uso ai server Model Context Protocol. Nutanix Kubernetes Platform offre un ambiente quick-start con un ricco catalogo di servizi AI e accesso integrato ai dati privati per gli sviluppatori di applicazioni di Agentic AI.

Grafico dell'operativizzazione dell'AI agentica

Rendi pienamente operativa l'AI agentica

La soluzione Nutanix Agentic AI è progettata per integrarsi perfettamente e completare le AI factory certificate NVIDIA, sfruttando solide relazioni con i partner per offrire soluzioni complete da importanti produttori OEM di hardware, tra cui Cisco, Dell e Supermicro.

Diagramma della soluzione NVIDIA

Componenti chiave integrati

Servizi AI e piattaforma Kubernetes

Questo ambiente cloud-native, incentrato sugli sviluppatori, permette ai team di bypassare il setup dell'infrastruttura e scalare immediatamente le applicazioni Agentic AI di livello di produzione con costi di token prevedibili.

Ottimizzazione e sicurezza dell'infrastruttura

Orchestra la potenza del computing accelerato in formato VM, offrendo massime prestazioni e sicurezza per ottenere un costo per token inferiore.

Servizi dati fondamentali per l'AI

Fornisce il data fabric ad alte prestazioni necessario per collegare training e inferenza tramite una trasformazione continua e accelerata dalla GPU direttamente all'interno del cluster di storage.

Servizi AI e piattaforma Kubernetes

Persona che utilizza la console

Gateway AI avanzato e servizi di inferenza

Un endpoint di inferenza unificato e sicuro consente alle aziende di utilizzare modelli ospitati nel cloud (e crediti token) insieme a LLM privati con autenticazione coerente, osservabilità e rate limiting basato su token.

Supporto al Model Context Protocol e all'ottimizzazione

Nutanix Enterprise AI estende le sue robuste funzionalità di Model-as-a-Service (MaaS) esistenti per consentire agli agenti di connettersi in modo sicuro a strumenti aziendali e fonti di dati.

Piattaforma Kubernetes aperta con ricco catalogo AI

Porta le applicazioni di AI agentica dal concept alla produzione senza ritardi infrastrutturali, usando un catalogo pre-validato di servizi AI open source, inclusi notebook, database di vettori e motori MLOps. La soluzione è nativamente integrata con NVIDIA AI Enterprise per consentire agli sviluppatori di implementare istantaneamente i NIM NVIDIA, inclusi Nemotron, accelerando lo sviluppo di applicazioni AI ad alte prestazioni in produzione.

Ottimizzazione e sicurezza dell'infrastruttura

Luci della città di notte

Ottimizzazione consapevole della topologia

L'hypervisor Nutanix AHV garantisce un allineamento rigoroso con l'hardware senza la complessità del tuning manuale dell'infrastruttura, per ottenere prestazioni, sicurezza e utilizzo delle risorse ottimali, ottimizzando automaticamente il posizionamento dei carichi di lavoro su server ad alta densità di GPU.

Networking zero trust accelerato da DPU

Usando Nutanix Flow con le nuove capacità di accelerazione tramite DPU, è possibile avere prestazioni paragonabili a quelle di un server bare metal, mantenendo però l'isolamento e la sicurezza di un ambiente virtualizzato, il tutto su un'infrastruttura di rete ad alte prestazioni e basata sul modello zero trust, pensata per garantire velocità, affidabilità e sicurezza nello scambio dei dati all'interno dell'ecosistema di AI.

Gestione del ciclo di vita in ambienti air-gapped

La soluzione supporta installazioni completamente disconnesse dell'intera piattaforma NKP e degli operatori GPU e di rete di NVIDIA, consentendo ad ambienti altamente regolamentati o del settore difesa di automatizzare gli aggiornamenti dei driver e l'ottimizzazione della rete senza esporre il cluster a Internet.

Servizi dati fondamentali per l'AI

Grafica generica di luci

Scalabilità lineare

Come piattaforma dati AI certificata NVIDIA-Enterprise, Nutanix Unified Storage offre prestazioni di lettura/scrittura ad alta velocità su migliaia di client GPU, garantendo che la disponibilità dei dati scalino alla stessa velocità della capacità di calcolo.

Throughput avanzato

Garantisce che le GPU non siano mai "a corto" di dati, sfruttando NFS su RDMA e, prossimamente, S3 su RDMA per fornire un percorso dati a bassa latenza.

Ottimizzazione dei costi

Riduce il costo aggregato per token e libera preziosa memoria GPU offrendo un tier ad alta capacità per l'offloading della cache KV, consentendo di elaborare finestre di contesto significativamente più ampie e un numero maggiore di utenti contemporanei senza penalizzazioni delle prestazioni.

Nutanix può contare sulla fiducia di


Fai un test drive

Esegui interferenze AI su larga scala con Nutanix Enterprise AI

Pronto per una demo?

Parla con il nostro team di esperti per scoprire come Nutanix può aiutarti a estendere l'AI negli ambienti multicloud ibridi.

Domande frequenti

La soluzione Nutanix Agentic AI semplifica la complessità e crea un ponte fluido tra gli sviluppatori di AI agentica e gli operatori delle AI factory. Questa Soluzione full-stack offre un modello operativo cloud per gli operatori delle AI factory, semplificando le operazioni, massimizzando le prestazioni e la sicurezza, e ottimizzando i costi dei token. Allo stesso tempo, consente agli sviluppatori di AI agentica di concentrarsi su innovazione, gestione dei modelli e scaling rapido delle inferenze.

Gli sviluppatori di AI agentica affrontano un elevato grado di "attrito innovativo" mentre navigano in un panorama frammentato di modelli, strumenti e silos di dati, invece di concentrarsi sulla costruzione di intelligence. Gli sviluppatori non dispongono di un percorso unificato e sicuro per sfruttare LLM diversificati e strumenti open source per trasformare rapidamente le applicazioni da semplici interfacce di chat a sofisticate AI agentiche capaci di generare risultati di business concreti.

Per gli operatori di AI factory, la sfida più grande è fornire valore di business misurato in termini di tempo per token e costo per token a causa della complessità delle operazioni nelle AI factory, come: 

  • Complessità nella gestione di hardware AI diversificato e in rapida evoluzione (GPU, networking, storage), 
  • Complessità nel fornire un accesso condiviso all'infrastruttura critica dell'AI, garantendo al contempo un accesso sicuro ai modelli e ai dati e rispettando i requisiti di sovranità.
  • Complessità di fornire costantemente le massime prestazioni, ottimizzando al contempo l'utilizzo delle risorse nell'intera AI factory.
  • Complessità nella gestione del ciclo di vita di soluzioni puntuali frammentate e su misura a supporto delle operazioni delle AI factory

Il modello operativo cloud è l'approccio di Nutanix per colmare il divario tra sviluppatori di AI e team di infrastruttura. Invece di gestire soluzioni puntuali frammentate o cluster bare metal complessi, questo modello fornisce un ambiente unificato e full-stack. Consente agli operatori di governare l'infrastruttura di AI (GPU, DPU e storage) con la stessa facilità di un servizio cloud, offrendo allo stesso tempo agli sviluppatori un accesso immediato e sicuro agli strumenti e ai modelli di cui hanno bisogno per scalare migliaia di agenti intelligenti.

Nutanix ottimizza l'aspetto economico dei token attraverso diverse efficienze integrate:

  • Ottimizzazione consapevole della topologia: l'hypervisor AHV posiziona automaticamente i carichi di lavoro sui server ad alta densità di GPU per massimizzare l'allineamento dell'hardware.
  • Offload delle risorse: l'uso di DPU (unità di elaborazione dati) per gestire compiti di rete e sicurezza libera cicli GPU specifici per l'inferenza.
  • Smart Storage: Nutanix Unified Storage offre un livello ad alta capacità per l'offload della cache KV, che consente di risparmiare la costosa memoria GPU e permette di utilizzare finestre di contesto più ampie senza penalizzare le prestazioni.

Sebbene il bare-metal fosse lo standard per il training iniziale del modello, spesso manca della sicurezza e dell'isolamento necessari per scalare gli agenti in un'azienda. Nutanix utilizza l'infrastruttura Kubernetes basata su VM per fornire:

  • Isolamento superiore: confini più solidi per la multi-tenancy e la sicurezza tra i diversi carichi di lavoro di AI.
  • Gestione su larga scala: gestione semplificata del ciclo di vita e delle risorse.
  • Prestazioni bare metal: sfruttando l'accelerazione tramite DPU e la consapevolezza della topologia, Nutanix offre la velocità del bare metal con il controllo di un ambiente virtualizzato.

Il NAI Gateway funge da "porta d'ingresso" sicura per tutti i modelli AI. Offre un endpoint di inferenza unificato che consente alle aziende di gestire i modelli ospitati nel cloud e gli LLM privati in un unico luogo. Le caratteristiche principali includono:

  • Governance: limitazione della velocità basata su token per prevenire il "bill shock".
  • Osservabilità: visibilità completa su chi sta consumando risorse e come.
  • Connettività: supporto per il Model Context Protocol (MCP), che consente agli agenti di connettersi in modo sicuro a dati e strumenti aziendali privati.

La soluzione riduce la “frizione dell’innovazione” offrendo un ambiente incentrato sugli sviluppatori in cui è possibile bypassare la configurazione dell'infrastruttura. Attraverso la Nutanix Kubernetes Platform (NKP), gli sviluppatori ottengono accesso a un ricco catalogo di AI che include:

  • Strumenti open source preconfigurati (notebook, database vettoriali, motori MLOps).
  • Implementazione immediata dei NIM NVIDIA e della famiglia di modelli NVIDIA Nemotron.
  • Endpoint di inferenza sicuri in un clic e accesso chiavi in mano ai servizi di messa a punto.

Nutanix Unified Storage offre una piattaforma dati scalabile e ad alte prestazioni, progettata appositamente per carichi di lavoro moderni come l'AI e le applicazioni di nuova generazione. Le funzionalità principali includono:

  • Throughput di lettura ultra-veloce e capacità all-NVMe ad alta densità per gestire dataset di grandi dimensioni nelle pipeline AI, inclusi l'inferenza e il Retrieval-Augmented Generation (RAG).
  • Integrazione con Nutanix Kubernetes Platform, che consente la distribuzione senza soluzione di continuità di pipeline AI/ML containerizzate e applicazioni cloud-native.
  • Accesso ai dati multi-protocollo, semplificazione dello storage per diversi carichi di lavoro e accelerazione dell'innovazione.