Agentische KI

Ihre KI-Fabrik benötigt eine Infrastruktur, die tatsächlich funktioniert

Die meisten KI-Plattformen versprechen KI im großen Maßstab, sind aber komplex. Die agentische KI von Nutanix ist eine Full-Stack-Softwarelösung, die ein Cloud-Betriebsmodell bietet, um Unternehmen beim Aufbau, Betrieb und der Verwaltung von KI-Fabriken zu unterstützen. Durch die Integration in das Accelerated Computing-Ökosystem von NVIDIA vereinfacht die Lösung den Betrieb, maximiert die Performance und Sicherheit und optimiert die GPU-Auslastung und die Token-Kosten.

Ein Cloud-Betriebsmodell für KI-Fabriken

Nutanix bietet ein Cloud-Betriebsmodell, das speziell für die Ära der KI-Mitarbeiter in KI-Fabriken entwickelt wurde. Die Lösung für agentische KI von Nutanix abstrahiert Komplexität und unterstützt IT-Entscheidungsträger dabei, Performance, Sicherheit und Kosten in Balance zu halten. Dadurch werden Abläufe nicht nur vereinfacht, sondern auch die Wirtschaftlichkeit von KI grundlegend optimiert.

Grafik zur Minimierung der Kosten pro Token

Minimierung der Kosten pro Token

Die Full-Stack-Lösung bietet intelligentes Routing, Inferenz-Skalierung, topologiebewusste Ressourcenplatzierung und einen optimierten GPU-Einsatz, um die Kosten pro Token zu senken.

Grafik zur Unternehmenssicherheit

Gewährleisten Sie Sicherheit und Kontrolle auf Unternehmensniveau

Nutanix Enterprise-KI bietet sichere Bereitstellungen und Enterprise-Kontrollen für Ihre LLM-Endpunkte, während Erweiterungen für Nutanix AHV (Virtualisierung) und Nutanix Flow (Netzwerk und Sicherheit) für eine noch stärkere Isolation und höhere Sicherheit sorgen.

Entwicklergeschwindigkeit Grafik

Beschleunigen Sie die Entwicklergeschwindigkeit

Vom Konzept zur Produktion ohne Infrastrukturverzögerungen. Nutanix Enterprise-KI vereinfacht den Einsatz von KI-Tools durch intelligentes Model Routing, sichere Inferenz-Endpunkte mit nur einem Klick und sicheren, schlüsselfertigen Zugriff auf Model Context Protocol-Server. Mit der Nutanix Kubernetes Platform erhalten Entwickler agentischer KI-Anwendungen eine schnell einsatzbereite Umgebung mit einer breiten Auswahl an KI-Services und integriertem Zugriff auf private Daten.

Agentische KI operationalisieren Grafik

Agentische KI vollständig operationalisieren

Die Lösung für agentische KI von Nutanix wurde speziell dafür entwickelt, sich nahtlos in NVIDIA-zertifizierte KI-Fabriken zu integrieren und diese optimal zu ergänzen. Dank enger Partnerbeziehungen bietet Nutanix vollständige Lösungen führender OEM-Hardwarehersteller, darunter Cisco, Dell Technologies und Supermicro.

NVIDIA Lösungsdiagramm

Wichtige integrierte Komponenten

KI-Services und Kubernetes-Plattform

Diese entwicklerzentrierte, Cloud-native Umgebung ermöglicht es Teams, die Infrastruktureinrichtung zu umgehen und agentische KI-Anwendungen in Produktionsqualität sofort mit vorhersehbarer Token-Ökonomie zu skalieren.

Infrastrukturoptimierung und Sicherheit

Nutzt die Leistungsfähigkeit beschleunigter Rechenprozesse durch einen VM-Formfaktor und bietet maximale Performance und Sicherheit bei gleichzeitig niedrigeren Kosten pro Token.

Grundlegende Datenservices für KI

Bietet die leistungsstarke Dateninfrastruktur, die erforderlich ist, um Training und Inferenz durch kontinuierliche, GPU-beschleunigte Transformation direkt innerhalb des Speicherclusters zu verbinden.

KI-Services und Kubernetes-Plattform

Person, die die Konsole verwendet

Erweiterte KI-Gateway- und Inferenz-Services

Ein einheitlicher, sicherer Inferenz-Endpunkt ermöglicht es Unternehmen, in der Cloud gehostete Modelle (und Token-Guthaben) neben privaten LLMs mit konsistenter Authentifizierung, Beobachtbarkeit und Token-basierter Ratenbegrenzung zu nutzen.

Unterstützung und Feinabstimmung des Modellkontextprotokolls

Nutanix Enterprise-KI erweitert seine bestehenden zuverlässigen Model-as-a-Service (MaaS)-Funktionen, um Agenten die sichere Verbindung zu Unternehmenstools und Datenquellen zu ermöglichen.

Offene Kubernetes-Plattform mit umfangreichem KI-Katalog

Verschieben Sie agentische Anwendungen vom Konzept zur Produktion, ohne Infrastrukturverzögerungen, indem Sie einen vorvalidierten Katalog von Open-Source-KI-Services nutzen, einschließlich Notebooks, Vektordatenbanken und MLOps-Engines. Die Lösung ist nativ mit NVIDIA AI Enterprise integriert, sodass Entwickler NVIDIA-NIMs, einschließlich Nemotron, sofort bereitstellen können, um die Entwicklung leistungsstarker KI-Anwendungen in der Produktion zu beschleunigen.

Infrastrukturoptimierung und Sicherheit

Stadtlichter bei Nacht

Topologiebewusste Optimierung

Der Nutanix AHV-Hypervisor gewährleistet eine strikte Hardwareausrichtung ohne die Komplexität einer manuellen Infrastruktur-Optimierung für maximale Performance, Sicherheit und Ressourcennutzung, indem er die Workload-Platzierung automatisch auf GPU-dichten Servern optimiert.

DPU-beschleunigtes Zero-Trust-Netzwerk

Durch die Nutzung von Nutanix Flow mit den neuen DPU-Offload-Funktionen wird die Rohgeschwindigkeit von Bare-Metal-Systemen mit der ausgefeilten Isolation einer virtualisierten Umgebung kombiniert. Die leistungsstarke Zero-Trust-Netzwerkgrundlage maximiert den Durchsatz und gewährleistet gleichzeitig einen sicheren und zuverlässigen Datenfluss in der gesamten KI-Fabrik.

Lifecycle-Management für Air-Gap-Umgebungen

Die Lösung unterstützt vollständig getrennte Installationen der gesamten NKP-Plattform sowie der NVIDIA-GPU- und Netzwerkbetreiber, sodass stark regulierte Umgebungen oder Umgebungen des Verteidigungssektors Driver-Updates und Netzwerkoptimierung automatisieren können, ohne den Cluster dem Internet auszusetzen.

Grundlegende Datenservices für KI

Generische Lichter Grafik

Lineare Skalierbarkeit

Als NVIDIA-Enterprise-zertifizierte KI-Datenplattform liefert Nutanix Unified Storage eine Hochgeschwindigkeit von Lese-/Schreib-Performance über Tausende von GPU-Clients hinweg und stellt sicher, dass die Datenverfügbarkeit genauso schnell skaliert wie Ihre Rechenleistung.

Erweiterter Durchsatz

Gewährleistet, dass GPUs niemals „ausgehungert“ werden, indem NFS über RDMA und bald auch S3 über RDMA genutzt werden, um einen Datenpfad mit niedriger Latenz bereitzustellen.

Kostenoptimierung

Durch die Bereitstellung einer Hochleistungsebene für das KV-Cache-Offloading werden die Gesamtkosten pro Token gesenkt und kritischer GPU-Speicher freigegeben. Dadurch können Sie deutlich größere Kontextfenster und mehr gleichzeitige Anwender ohne Leistungseinbußen verarbeiten.

Nutanix genießt das Vertrauen von:


Machen Sie einen Test Drive

Führen Sie KI-Interferenzen in großem Umfang mit Nutanix Enterprise-KI durch

Bereit für eine Demo?

Sprechen Sie mit einem Experten darüber, wie Nutanix Sie bei der Erweiterung von KI auf hybride Multi-Cloud-Umgebungen unterstützen kann.

Häufig gestellte Fragen

Die agentische KI-Lösung von Nutanix abstrahiert Komplexität und schafft eine nahtlose Brücke von den Entwicklern von KI-Agenten zu den KI-Fabrikbetreibern. Diese Full-Stack-Lösung bietet ein Cloud-Betriebsmodell für KI-Fabrikbetreiber, indem sie den Betrieb vereinfacht, Leistung und Sicherheit maximiert und die Token-Kosten optimiert. Gleichzeitig ermöglicht es den Entwicklern von KI-Agenten, sich auf Innovation, Modellmanagement und die schnelle Skalierung von Inferenz-Prozessen zu konzentrieren.

Entwickler von agentenbasierter KI sehen sich in einem hohen Maß mit „Innovationsreibung“ konfrontiert, da sie sich in einer fragmentierten Landschaft von Modellen, Werkzeugen und Datensilos zurechtfinden müssen, anstatt sich auf den Aufbau von Intelligenz zu konzentrieren. Entwicklern fehlt ein einheitlicher, sicherer Weg, um diverse LLMs und Open-Source-Tools für die schnelle Weiterentwicklung von Anwendungen zu nutzen – von einfachen Chat-Schnittstellen bis hin zu anspruchsvoller agentenbasierter KI, die in der Lage ist, echte Geschäftsergebnisse zu erzielen.

Für KI-Fabrikbetreiber ist die größte Herausforderung, geschäftlichen Nutzen zu liefern, gemessen in Zeit bis zu Tokens und Kosten pro Token aufgrund der Komplexität der Operationen in KI-Fabriken wie: 

  • Komplexität bei der Verwaltung vielfältiger und sich schnell entwickelnder KI-Hardware (GPUs, Netzwerke, Storage), 
  • Die Komplexität, einen gemeinsamen Zugang zu kritischer KI-Infrastruktur zu gewährleisten, den sicheren Zugriff auf Modelle und Daten sicherzustellen und die Souveränitätsanforderungen einzuhalten
  • Die Komplexität der konsistenten Bereitstellung maximaler Performance bei gleichzeitiger Optimierung der Ressourcennutzung in der gesamten KI-Fabrik.
  • Die Komplexität der Verwaltung des Lebenszyklus von fragmentierten, maßgeschneiderten Einzellösungen zur Unterstützung von KI-Fabrikprozessen

Das Cloud-Betriebsmodell ist der Ansatz von Nutanix, der die Lücke zwischen KI-Entwicklern und Infrastruktur-Teams schließt. Anstatt fragmentierte Insellösungen oder komplexe Bare-Metal-Cluster zu verwalten, stellt dieses Modell eine einheitliche Full-Stack-Umgebung bereit. Sie ermöglicht es Betreibern, KI-Infrastruktur (GPUs, DPUs und Storage) so einfach wie einen Cloud-Dienst zu verwalten, und gibt Entwicklern sofortigen, sicheren Zugriff auf die Tools und Modelle, die sie benötigen, um Tausende intelligenter Agenten zu skalieren.

Nutanix optimiert die Wirtschaftlichkeit von Token durch mehrere integrierte Effizienzsteigerungen:

  • Topologiebewusste Optimierung: Der AHV-Hypervisor platziert Workloads automatisch auf GPU-dichten Servern, um eine optimale Hardwarezuordnung zu erzielen.
  • Ressourcen-Offloading: Die Verwendung von DPUs (Data Processing Units) zur Handhabung von Netzwerk- und Sicherheitsaufgaben setzt GPU-Zyklen speziell für die Inferenz frei.
  • Intelligenter Speicher: Nutanix Unified Storage bietet eine Hochleistungsschicht für das KV-Cache-Offloading, wodurch teurer GPU-Speicher gespart und größere Kontextfenster ohne Leistungseinbußen ermöglicht werden.

Während Bare-Metal der Standard für das anfängliche Modelltraining war, fehlt es oft an der Sicherheit und Isolation, die für die Skalierung von Agenten in einem Unternehmen erforderlich sind. Nutanix verwendet eine VM-basierte Kubernetes-Infrastruktur, um Folgendes bereitzustellen:

  • Leistungsstarke Isolation: Stärkere Multi-Tenancy- und Sicherheitsgrenzen zwischen verschiedenen KI-Workloads.
  • Management at Scale: Einfacheres Lebenszyklusmanagement und Ressourcenzuweisung.
  • Bare-Metal-Performance: Durch die Nutzung der DPU-Beschleunigung und Topologieerkennung bietet Nutanix die Geschwindigkeit von Bare-Metal mit der Steuerung einer virtualisierten Umgebung.

Das NAI Gateway fungiert als sichere „Eingangstür“ für alle KI-Modelle. Es bietet einen einheitlichen Inferenz-Endpunkt, der es Unternehmen ermöglicht, in der Cloud gehostete Modelle und private LLMs an einem Ort zu verwalten. Zu den wichtigsten Merkmalen gehören:

  • Governance: Tokenbasierte Ratenbegrenzung zur Vermeidung von „Rechnungsschocks“.
  • Beobachtbarkeit: Vollständige Einsicht darüber, wer Ressourcen verbraucht und wie.
  • Konnektivität: Unterstützung für das Model Context Protocol (MCP), das es Agenten ermöglicht, sich sicher mit privaten Unternehmensdaten und -tools zu verbinden.

Die Lösung reduziert „Innovationsreibung“, indem sie eine entwicklerzentrierte Umgebung bietet, in der sie das Infrastruktur-Setup umgehen können. Durch die Nutanix Kubernetes Platform (NKP) erhalten Entwickler Zugang zu einem umfangreichen KI-Katalog, einschließlich:

  • Vorgefertigte Open-Source-Tools (Notebooks, Vektordatenbanken, MLOps-Engines).
  • Sofortige Bereitstellung von NVIDIA NIMs und der NVIDIA Nemotron-Modellfamilie.
  • Sichere Inferenz-Endpunkte mit einem Klick und schlüsselfertigem Zugang zu Feinabstimmungs-Services.

Nutanix Unified Storage bietet eine skalierbare, leistungsstarke Datenplattform, die speziell für moderne Workloads wie KI und Anwendungen der nächsten Generation entwickelt wurde. Zu den wichtigsten Funktionen gehören:

  • Ultraschneller Lesedurchsatz und hohe NVMe-Kapazität zur Verarbeitung massiver Datensätze für KI-Pipelines, einschließlich Inferenz und Retrieval-Augmented Generation (RAG).
  • Integration mit der Nutanix Kubernetes Plattform, was eine nahtlose Einführung containerisierter KI/ML-Pipelines und Cloud-native Anwendungen ermöglicht.
  • Multi-Protokoll-Datenzugriff, der die Speicherung für verschiedene Workloads vereinfacht und Innovationen beschleunigt.