What is the Nutanix Agentic AI solution?

The Nutanix Agentic AI solution abstracts complexity and creates a seamless bridge from the agentic AI builders to the AI factory operators. This full-stack solution offers a cloud operating model for AI factory operators by simplifying operations, maximizing performance and security, and optimizing token costs. At the same time, it enables the agentic AI builders to focus on innovation, model management, and rapid inference scaling.

What is the core challenge the Nutanix Agentic AI solution solves?

Agentic AI builders face a high degree of "innovation friction" as they navigate a fragmented landscape of models, tools, and data silos instead of focusing on building intelligence. Developers lack a unified, secure path to leverage diverse LLMs and open-source tools to rapidly evolving applications from simple chat interfaces into sophisticated agentic AI capable of driving real business outcomes. For AI factory operators, the biggest challenge is delivering business value measured in terms of time to tokens and cost per token due to operations complexity in AI factories such as: Complexity in managing diverse and rapidly evolving AI hardware (GPUs, networking, storage), Complexity of providing shared access to critical AI infrastructure while ensuring secure access to model and data, and complying with sovereignty requirements Complexity of consistently delivering maximum performance, while optimizing resource utilization across the full AI factory. Complexity of managing the lifecycle of fragmented, bespoke point solutions supporting AI factory operations

What is the "Cloud Operating Model" for Agentic AI?

The Cloud Operating Model is Nutanix’s approach to bridging the gap between AI developers and infrastructure teams. Instead of managing fragmented point solutions or complex bare-metal clusters, this model provides a unified, full-stack environment. It allows operators to govern AI infrastructure (GPUs, DPUs, and storage) with the same ease as a cloud service, while giving developers instant, secure access to the tools and models they need to scale thousands of intelligent agents.

How does Nutanix help reduce the "cost per token"?

Nutanix optimizes token economics through several integrated efficiencies: Topology-Aware Optimization: The AHV hypervisor automatically places workloads across GPU-dense servers to maximize hardware alignment. Resource Offloading: Using DPUs (Data Processing Units) to handle networking and security tasks frees up GPU cycles specifically for inference. Smart Storage: Nutanix Unified Storage provides a high-capacity tier for KV Cache offloading, which saves expensive GPU memory and allows for larger context windows without a performance penalty.

Why does Nutanix recommend virtual machines (VMs) over bare-metal Kubernetes for AI?

While bare-metal was the standard for initial model training, it often lacks the security and isolation required for scaling agents in an enterprise. Nutanix uses VM-based Kubernetes infrastructure to provide: Superior Isolation: Stronger multi-tenancy and security boundaries between different AI workloads. Management at Scale: Easier lifecycle management and resource allocation. Bare-Metal Performance: By leveraging DPU acceleration and topology awareness, Nutanix delivers the speed of bare metal with the governance of a virtualized environment.

What is the Nutanix Enterprise AI (NAI) Gateway?

The NAI Gateway acts as a secure "front door" for all AI models. It provides a unified inference endpoint that allows enterprises to manage cloud-hosted models and private LLMs in one place. Key features include: Governance: Token-based rate limiting to prevent "bill shock." Observability: Full visibility into who is consuming resources and how. Connectivity: Support for the Model Context Protocol (MCP), which allows agents to securely connect to private enterprise data and tools.

How does this solution accelerate the work of Agentic AI builders?

The solution reduces "innovation friction" by providing a developer-centric environment where they can bypass infrastructure setup. Through the Nutanix Kubernetes Platform (NKP), builders gain access to a rich AI catalog including: Pre-built open-source tools (Notebooks, Vector Databases, MLOps engines). Instant deployment of NVIDIA NIMs and the NVIDIA Nemotron family of models. 1-click secure inference endpoints and turnkey access to fine-tuning services.

How does Nutanix Unified Storage (NUS) support AI and next-generation applications?

Nutanix Unified Storage provides a scalable, high-performance data platform purpose-built for modern workloads like AI and next-gen apps. Key capabilities include: Ultra-fast read throughput and dense all-NVMe capacity to handle massive datasets for AI pipelines, including Inferencing and Retrieval-Augmented Generation (RAG) . Integration with Nutanix Kubernetes Platform , enabling seamless deployment of containerized AI/ML pipelines and cloud-native applications. Multi-protocol data access, simplifying storage for diverse workloads and accelerating innovation.

Agentische KI

Ihre KI-Fabrik benötigt eine Infrastruktur, die tatsächlich funktioniert

Die meisten KI-Plattformen versprechen KI im großen Maßstab, sind aber komplex. Die agentische KI von Nutanix ist eine Full-Stack-Softwarelösung, die ein Cloud-Betriebsmodell bietet, um Unternehmen beim Aufbau, Betrieb und der Verwaltung von KI-Fabriken zu unterstützen. Durch die Integration in das Accelerated Computing-Ökosystem von NVIDIA vereinfacht die Lösung den Betrieb, maximiert die Performance und Sicherheit und optimiert die GPU-Auslastung und die Token-Kosten.

Lesen Sie den Blog

Ein Cloud-Betriebsmodell für KI-Fabriken

Nutanix bietet ein Cloud-Betriebsmodell, das speziell für die Ära der KI-Mitarbeiter in KI-Fabriken entwickelt wurde. Die Lösung für agentische KI von Nutanix abstrahiert Komplexität und unterstützt IT-Entscheidungsträger dabei, Performance, Sicherheit und Kosten in Balance zu halten. Dadurch werden Abläufe nicht nur vereinfacht, sondern auch die Wirtschaftlichkeit von KI grundlegend optimiert.

Minimierung der Kosten pro Token

Die Full-Stack-Lösung bietet intelligentes Routing, Inferenz-Skalierung, topologiebewusste Ressourcenplatzierung und einen optimierten GPU-Einsatz, um die Kosten pro Token zu senken.

Gewährleisten Sie Sicherheit und Kontrolle auf Unternehmensniveau

Nutanix Enterprise-KI bietet sichere Bereitstellungen und Enterprise-Kontrollen für Ihre LLM-Endpunkte, während Erweiterungen für Nutanix AHV (Virtualisierung) und Nutanix Flow (Netzwerk und Sicherheit) für eine noch stärkere Isolation und höhere Sicherheit sorgen.

Beschleunigen Sie die Entwicklergeschwindigkeit

Vom Konzept zur Produktion ohne Infrastrukturverzögerungen. Nutanix Enterprise-KI vereinfacht den Einsatz von KI-Tools durch intelligentes Model Routing, sichere Inferenz-Endpunkte mit nur einem Klick und sicheren, schlüsselfertigen Zugriff auf Model Context Protocol-Server. Mit der Nutanix Kubernetes Platform erhalten Entwickler agentischer KI-Anwendungen eine schnell einsatzbereite Umgebung mit einer breiten Auswahl an KI-Services und integriertem Zugriff auf private Daten.

Agentische KI vollständig operationalisieren

Die Lösung für agentische KI von Nutanix wurde speziell dafür entwickelt, sich nahtlos in NVIDIA-zertifizierte KI-Fabriken zu integrieren und diese optimal zu ergänzen. Dank enger Partnerbeziehungen bietet Nutanix vollständige Lösungen führender OEM-Hardwarehersteller, darunter Cisco, Dell Technologies und Supermicro.

Wichtige integrierte Komponenten

KI-Services und Kubernetes-Plattform

Diese entwicklerzentrierte, Cloud-native Umgebung ermöglicht es Teams, die Infrastruktureinrichtung zu umgehen und agentische KI-Anwendungen in Produktionsqualität sofort mit vorhersehbarer Token-Ökonomie zu skalieren.

Infrastrukturoptimierung und Sicherheit

Nutzt die Leistungsfähigkeit beschleunigter Rechenprozesse durch einen VM-Formfaktor und bietet maximale Performance und Sicherheit bei gleichzeitig niedrigeren Kosten pro Token.

Grundlegende Datenservices für KI

Bietet die leistungsstarke Dateninfrastruktur, die erforderlich ist, um Training und Inferenz durch kontinuierliche, GPU-beschleunigte Transformation direkt innerhalb des Speicherclusters zu verbinden.

KI-Services und Kubernetes-Plattform

Erweiterte KI-Gateway- und Inferenz-Services

Ein einheitlicher, sicherer Inferenz-Endpunkt ermöglicht es Unternehmen, in der Cloud gehostete Modelle (und Token-Guthaben) neben privaten LLMs mit konsistenter Authentifizierung, Beobachtbarkeit und Token-basierter Ratenbegrenzung zu nutzen.

Unterstützung und Feinabstimmung des Modellkontextprotokolls

Nutanix Enterprise-KI erweitert seine bestehenden zuverlässigen Model-as-a-Service (MaaS)-Funktionen, um Agenten die sichere Verbindung zu Unternehmenstools und Datenquellen zu ermöglichen.

Offene Kubernetes-Plattform mit umfangreichem KI-Katalog

Verschieben Sie agentische Anwendungen vom Konzept zur Produktion, ohne Infrastrukturverzögerungen, indem Sie einen vorvalidierten Katalog von Open-Source-KI-Services nutzen, einschließlich Notebooks, Vektordatenbanken und MLOps-Engines. Die Lösung ist nativ mit NVIDIA AI Enterprise integriert, sodass Entwickler NVIDIA-NIMs, einschließlich Nemotron, sofort bereitstellen können, um die Entwicklung leistungsstarker KI-Anwendungen in der Produktion zu beschleunigen.

Infrastrukturoptimierung und Sicherheit

Topologiebewusste Optimierung

Der Nutanix AHV-Hypervisor gewährleistet eine strikte Hardwareausrichtung ohne die Komplexität einer manuellen Infrastruktur-Optimierung für maximale Performance, Sicherheit und Ressourcennutzung, indem er die Workload-Platzierung automatisch auf GPU-dichten Servern optimiert.

DPU-beschleunigtes Zero-Trust-Netzwerk

Durch die Nutzung von Nutanix Flow mit den neuen DPU-Offload-Funktionen wird die Rohgeschwindigkeit von Bare-Metal-Systemen mit der ausgefeilten Isolation einer virtualisierten Umgebung kombiniert. Die leistungsstarke Zero-Trust-Netzwerkgrundlage maximiert den Durchsatz und gewährleistet gleichzeitig einen sicheren und zuverlässigen Datenfluss in der gesamten KI-Fabrik.

Lifecycle-Management für Air-Gap-Umgebungen

Die Lösung unterstützt vollständig getrennte Installationen der gesamten NKP-Plattform sowie der NVIDIA-GPU- und Netzwerkbetreiber, sodass stark regulierte Umgebungen oder Umgebungen des Verteidigungssektors Driver-Updates und Netzwerkoptimierung automatisieren können, ohne den Cluster dem Internet auszusetzen.

Grundlegende Datenservices für KI

Lineare Skalierbarkeit

Als NVIDIA-Enterprise-zertifizierte KI-Datenplattform liefert Nutanix Unified Storage eine Hochgeschwindigkeit von Lese-/Schreib-Performance über Tausende von GPU-Clients hinweg und stellt sicher, dass die Datenverfügbarkeit genauso schnell skaliert wie Ihre Rechenleistung.

Erweiterter Durchsatz

Gewährleistet, dass GPUs niemals „ausgehungert“ werden, indem NFS über RDMA und bald auch S3 über RDMA genutzt werden, um einen Datenpfad mit niedriger Latenz bereitzustellen.

Kostenoptimierung

Durch die Bereitstellung einer Hochleistungsebene für das KV-Cache-Offloading werden die Gesamtkosten pro Token gesenkt und kritischer GPU-Speicher freigegeben. Dadurch können Sie deutlich größere Kontextfenster und mehr gleichzeitige Anwender ohne Leistungseinbußen verarbeiten.

Nutanix genießt das Vertrauen von:

Case Study

University of Canberra

„Wir passen unsere IT mithilfe von Nutanix an, um KI und ML an der gesamten Universität, einschließlich unserer Forschungszentren, zu unterstützen. Das hilft auch dabei, die Anwendungen bereitzustellen, die Studierende und Lehrende aus der Ferne benötigen.“

– Matt Carmichael, CIO, University of Canberra

Industries:Education
Nutanix Cloud Infrastructure (NCI):AHV Virtualization, AOS Storage
Nutanix Cloud Manager (NCM):Cost Governance
Products:Nutanix Cloud Infrastructure (NCI), Nutanix Cloud Manager (NCM)
Region:APAC
Resource Type:Case Study
Use Cases:AI ML, Big Data Analytics, Database-as-a-Service, End User Computing (EUC), Hybrid Multicloud, Sustainability & IT

1. Dezember 2025

Case Study

IndianOil

„Dank der Unterstützung von KI-Workloads durch Nutanix arbeitet die Forschungs- und Entwicklungsabteilung mindestens 20 % effizienter.“

- N.K. Malik, General Manager, Informationssysteme, IndianOil R&D

Industries:Government, Oil & Gas
Key Play:VMware Alternative Broadcom Compete
Nutanix Central:Prism
Nutanix Cloud Infrastructure (NCI):AHV Virtualization, Flow Network Security
Products:Nutanix Central, Nutanix Cloud Infrastructure (NCI)
Region:APAC
Resource Type:Case Study
Use Cases:AI ML, Business Continuity & Disaster Recovery, Private Cloud, Sustainability & IT

12. Januar 2026

Case Study

Indonesiens Wahlausschuss (KPU)

„KI hat unsere Recherchezeit auf unter 3 Minuten verkürzt – das steigert die Zufriedenheit im Team und gewährleistet den sofortigen Zugriff auf genaue Wahlergebnisse.“

- Andre Putra Hermawan, Kepala Divisi Pusat Data dan Teknologi Informasi (PUSDATIN)

Industries:Government
Products:Nutanix Cloud Infrastructure (NCI), Nutanix Database Service (NDB), Nutanix Enterprise AI (NAI), Nutanix Kubernetes Platform (NKP), Nutanix Unified Storage (NUS)
Resource Type:Case Study
Use Cases:AI ML, Private Cloud

1. Dezember 2025

Weitere Kundenreferenzen

Entdecken Sie unsere Ressourcen

Nutanix stellt die agentische KI von Nutanix vor – eine Full-Stack-Softwarelösung zur Erschließung des Potenzials von KI-Fabriken für Unternehmen

Nutanix Agentische KI, eine umfassende Softwarelösung, die speziell entwickelt wurde, um Kunden bei der beschleunigten Einführung von agentischer KI für die Unternehmenstransformation zu unterstützen.

Nutanix:Press Releases
Use Cases:AI ML
Years:2026

16. März 2026

Führen Sie KI wie all Ihre anderen Workloads aus

Um KI-Workloads einfach und sicher bereitzustellen, zu skalieren und zu verwalten, können Unternehmen die Komplexität der Infrastruktur minimieren, indem sie sich auf wichtige Erfolgsfaktoren konzentrieren und dabei ihre bestehende IT-Grundlage und ihre vorhandenen Fähigkeiten nutzen.

Blog Post

Optimierung der Netzwerk-Performance für KI-Workloads: Nutanix und NVIDIAs kollaborativer Ansatz

Für einen effizienten Betrieb von KI-Workloads ist eine leistungsstarke, sichere und zuverlässige Netzwerkinfrastruktur erforderlich. Nutanix bietet hochoptimierte Netzwerkfunktionen, die auf diese Anforderungen zugeschnitten sind und eine robuste Grundlage für KI-Anwendungen bieten.

Products:Nutanix Cloud Platform (NCP)
Resource Type:Blog Post
Use Cases:AI ML

28. Oktober 2025

Machen Sie einen Test Drive

Führen Sie KI-Interferenzen in großem Umfang mit Nutanix Enterprise-KI durch

Machen Sie den KI Test Drive

Bereit für eine Demo?

Sprechen Sie mit einem Experten darüber, wie Nutanix Sie bei der Erweiterung von KI auf hybride Multi-Cloud-Umgebungen unterstützen kann.

Häufig gestellte Fragen

Die agentische KI-Lösung von Nutanix abstrahiert Komplexität und schafft eine nahtlose Brücke von den Entwicklern von KI-Agenten zu den KI-Fabrikbetreibern. Diese Full-Stack-Lösung bietet ein Cloud-Betriebsmodell für KI-Fabrikbetreiber, indem sie den Betrieb vereinfacht, Leistung und Sicherheit maximiert und die Token-Kosten optimiert. Gleichzeitig ermöglicht es den Entwicklern von KI-Agenten, sich auf Innovation, Modellmanagement und die schnelle Skalierung von Inferenz-Prozessen zu konzentrieren.

Entwickler von agentenbasierter KI sehen sich in einem hohen Maß mit „Innovationsreibung“ konfrontiert, da sie sich in einer fragmentierten Landschaft von Modellen, Werkzeugen und Datensilos zurechtfinden müssen, anstatt sich auf den Aufbau von Intelligenz zu konzentrieren. Entwicklern fehlt ein einheitlicher, sicherer Weg, um diverse LLMs und Open-Source-Tools für die schnelle Weiterentwicklung von Anwendungen zu nutzen – von einfachen Chat-Schnittstellen bis hin zu anspruchsvoller agentenbasierter KI, die in der Lage ist, echte Geschäftsergebnisse zu erzielen.

Für KI-Fabrikbetreiber ist die größte Herausforderung, geschäftlichen Nutzen zu liefern, gemessen in Zeit bis zu Tokens und Kosten pro Token aufgrund der Komplexität der Operationen in KI-Fabriken wie:

Komplexität bei der Verwaltung vielfältiger und sich schnell entwickelnder KI-Hardware (GPUs, Netzwerke, Storage),
Die Komplexität, einen gemeinsamen Zugang zu kritischer KI-Infrastruktur zu gewährleisten, den sicheren Zugriff auf Modelle und Daten sicherzustellen und die Souveränitätsanforderungen einzuhalten
Die Komplexität der konsistenten Bereitstellung maximaler Performance bei gleichzeitiger Optimierung der Ressourcennutzung in der gesamten KI-Fabrik.
Die Komplexität der Verwaltung des Lebenszyklus von fragmentierten, maßgeschneiderten Einzellösungen zur Unterstützung von KI-Fabrikprozessen

Das Cloud-Betriebsmodell ist der Ansatz von Nutanix, der die Lücke zwischen KI-Entwicklern und Infrastruktur-Teams schließt. Anstatt fragmentierte Insellösungen oder komplexe Bare-Metal-Cluster zu verwalten, stellt dieses Modell eine einheitliche Full-Stack-Umgebung bereit. Sie ermöglicht es Betreibern, KI-Infrastruktur (GPUs, DPUs und Storage) so einfach wie einen Cloud-Dienst zu verwalten, und gibt Entwicklern sofortigen, sicheren Zugriff auf die Tools und Modelle, die sie benötigen, um Tausende intelligenter Agenten zu skalieren.

Nutanix optimiert die Wirtschaftlichkeit von Token durch mehrere integrierte Effizienzsteigerungen:

Topologiebewusste Optimierung: Der AHV-Hypervisor platziert Workloads automatisch auf GPU-dichten Servern, um eine optimale Hardwarezuordnung zu erzielen.
Ressourcen-Offloading: Die Verwendung von DPUs (Data Processing Units) zur Handhabung von Netzwerk- und Sicherheitsaufgaben setzt GPU-Zyklen speziell für die Inferenz frei.
Intelligenter Speicher: Nutanix Unified Storage bietet eine Hochleistungsschicht für das KV-Cache-Offloading, wodurch teurer GPU-Speicher gespart und größere Kontextfenster ohne Leistungseinbußen ermöglicht werden.

Während Bare-Metal der Standard für das anfängliche Modelltraining war, fehlt es oft an der Sicherheit und Isolation, die für die Skalierung von Agenten in einem Unternehmen erforderlich sind. Nutanix verwendet eine VM-basierte Kubernetes-Infrastruktur, um Folgendes bereitzustellen:

Leistungsstarke Isolation: Stärkere Multi-Tenancy- und Sicherheitsgrenzen zwischen verschiedenen KI-Workloads.
Management at Scale: Einfacheres Lebenszyklusmanagement und Ressourcenzuweisung.
Bare-Metal-Performance: Durch die Nutzung der DPU-Beschleunigung und Topologieerkennung bietet Nutanix die Geschwindigkeit von Bare-Metal mit der Steuerung einer virtualisierten Umgebung.

Das NAI Gateway fungiert als sichere „Eingangstür“ für alle KI-Modelle. Es bietet einen einheitlichen Inferenz-Endpunkt, der es Unternehmen ermöglicht, in der Cloud gehostete Modelle und private LLMs an einem Ort zu verwalten. Zu den wichtigsten Merkmalen gehören:

Governance: Tokenbasierte Ratenbegrenzung zur Vermeidung von „Rechnungsschocks“.
Beobachtbarkeit: Vollständige Einsicht darüber, wer Ressourcen verbraucht und wie.
Konnektivität: Unterstützung für das Model Context Protocol (MCP), das es Agenten ermöglicht, sich sicher mit privaten Unternehmensdaten und -tools zu verbinden.

Die Lösung reduziert „Innovationsreibung“, indem sie eine entwicklerzentrierte Umgebung bietet, in der sie das Infrastruktur-Setup umgehen können. Durch die Nutanix Kubernetes Platform (NKP) erhalten Entwickler Zugang zu einem umfangreichen KI-Katalog, einschließlich:

Vorgefertigte Open-Source-Tools (Notebooks, Vektordatenbanken, MLOps-Engines).
Sofortige Bereitstellung von NVIDIA NIMs und der NVIDIA Nemotron-Modellfamilie.
Sichere Inferenz-Endpunkte mit einem Klick und schlüsselfertigem Zugang zu Feinabstimmungs-Services.

Nutanix Unified Storage bietet eine skalierbare, leistungsstarke Datenplattform, die speziell für moderne Workloads wie KI und Anwendungen der nächsten Generation entwickelt wurde. Zu den wichtigsten Funktionen gehören:

Ultraschneller Lesedurchsatz und hohe NVMe-Kapazität zur Verarbeitung massiver Datensätze für KI-Pipelines, einschließlich Inferenz und Retrieval-Augmented Generation (RAG).
Integration mit der Nutanix Kubernetes Plattform, was eine nahtlose Einführung containerisierter KI/ML-Pipelines und Cloud-native Anwendungen ermöglicht.
Multi-Protokoll-Datenzugriff, der die Speicherung für verschiedene Workloads vereinfacht und Innovationen beschleunigt.

Ihre KI-Fabrik benötigt eine Infrastruktur, die tatsächlich funktioniert

Ein Cloud-Betriebsmodell für KI-Fabriken

Minimierung der Kosten pro Token

Gewährleisten Sie Sicherheit und Kontrolle auf Unternehmensniveau

Beschleunigen Sie die Entwicklergeschwindigkeit

Agentische KI vollständig operationalisieren

Wichtige integrierte Komponenten

KI-Services und Kubernetes-Plattform

Erweiterte KI-Gateway- und Inferenz-Services

Unterstützung und Feinabstimmung des Modellkontextprotokolls

Offene Kubernetes-Plattform mit umfangreichem KI-Katalog

Infrastrukturoptimierung und Sicherheit

Topologiebewusste Optimierung

DPU-beschleunigtes Zero-Trust-Netzwerk

Lifecycle-Management für Air-Gap-Umgebungen

Grundlegende Datenservices für KI

Lineare Skalierbarkeit

Erweiterter Durchsatz

Kostenoptimierung

Nutanix genießt das Vertrauen von:

University of Canberra

IndianOil

Indonesiens Wahlausschuss (KPU)

Ähnliche Produkte

Entdecken Sie unsere Ressourcen

Machen Sie einen Test Drive

Bereit für eine Demo?

Häufig gestellte Fragen

Was ist die agentische KI-Lösung von Nutanix?

Welche zentrale Herausforderung löst die agentische KI-Lösung von Nutanix?

Was ist das „Cloud-Betriebsmodell“ für agentische KI?

Wie trägt Nutanix dazu bei, die „Kosten pro Token“ zu senken?

Warum empfiehlt Nutanix virtuelle Maschinen (VMs) gegenüber Bare-Metal-Kubernetes für KI?

Was ist das Nutanix Enterprise AI (NAI) Gateway?

Wie beschleunigt diese Lösung die Arbeit der Entwickler von agentischer KI?

Wie unterstützt Nutanix Unified Storage (NUS) KI und Anwendungen der nächsten Generation?