Nutanix AOS 6

Das HCI-Team von Nutanix

Wir freuen uns, mit der neuesten Version Nutanix AOS 6 einen großen Meilenstein unserer fortschrittlichen HCI-Software Nutanix® AOS bekanntgeben zu dürfen. Zehn Jahre nach der Lancierung unserer führenden HCI-Lösung auf der VMworld 2011 (und dem Gewinn des „Best of VMworld Awards“) ist die AOS™-Infrastruktursoftware von Nutanix zur Standardplattform für virtualisierte Rechenzentren in der Branche herangewachsen und nun unterstützt Nutanix seine Kunden dabei, eine Brücke zur hybriden Cloud zu schlagen.

Das ab sofort verfügbare AOS 6 bringt eine Reihe neuer innovativer Funktionen mit und baut damit weiter auf den Kernfunktionalitäten unserer differenzierten Architektur auf. Diese Version verbessert die Unterstützung von geschäftskritischen Workloads, indem sie das Erreichen maximaler Leistung sowie die Verbesserung der Transparenz und Kontrolle der Cluster-Resilienz noch einfacher macht. Zusätzlich vereinfacht AOS 6 mithilfe lang erwarteter Funktionalitäten — einschließlich Flow Networking und dem neuen DR-Dashboard — die Sicherung und den Schutz groß angelegter Bereitstellungen.

Leistung und Skalierung

Replikationsfaktor 1 (RF1)

Nutanix AOS schützt Anwendungsdaten für Workloads, die auf einem HCI-Cluster laufen, indem es mehrfache Kopien der Daten speichert. AOS speichert verschiedene Kopien auf unterschiedlichen Nodes innerhalb des Clusters, sodass Daten im Falle eines Hardwareausfalls automatisch wiederhergestellt werden können. Der sogenannte „Replikationsfaktor“ konnte bisher dahingehend konfiguriert werden, dass entweder zwei oder drei Kopien (respektive RF2 oder RF3) erstellt wurden. Viele moderne Big-Data-Anwendungen wie Hadoop®, SAS Analytics®, Splunk® und NoSQL®-Datenbanken schützen ihre eigenen Daten auf der Anwendungsebene, anstatt sich auf die zugrundeliegende Infrastruktur zu verlassen. Zudem speichern traditionelle SQL-Datenbanken oftmals auch einige temporäre Daten, die von Natur aus kurzlebig sind und nicht geschützt werden müssen. Diese Workloads erfordern keine zusätzliche Datenredundanz von der Speicherplattform.

Nutanix AOS unterstützt ab sofort die Erstellung von Storage-Containern mit Replikationsfaktor 1 (RF1), was bedeutet, dass Daten aus Redundanzgründen nicht mehr kopiert werden. Dies ermöglicht zwei zentrale Vorteile:

Speichereffizienz: Wenn Daten auf der Speicherebene nicht mehr kopiert werden, werden auch weniger physische Speichermedien benötigt, was in einer mindestens 50-prozentigen Einsparung von Speicherplatz für diese Art von Anwendungen resultiert.
Leistungssteigerung: Die E/A-Schreibleistung wird verbessert, weil Daten nicht über das gesamte Netzwerk kopiert werden müssen, was auch für Schreibvorgänge echte Datenlokalität bietet. Big-Data-Analyse-Workloads wie Cloudera profitieren von dreimal schnelleren Bearbeitungszeiten sowie dreimal größerer Datensatzverarbeitung und SAS Analytics profitiert von 2,5-fachen Durchsatzsteigerungen.

Metadata Re-Warming

Zusätzlich zu den neuen Funktionen, die Leistungszuwächse liefern, arbeitet Nutanix kontinuierlich an der Verbesserung der zugrundeliegenden Architektur. Eine dieser Verbesserungen betrifft die Leistungssteigerung direkt nach Vorgängen wie VM-Migrationen und Neustarts der Controller Virtual Machine aufgrund geplanter und ungeplanter Ereignisse. Anwendungen mit einem großen Arbeitsbereich und hohen IOPS-Anforderungen sind von derartigen Ereignissen besonders betroffen, da der In-Memory-Cache ungültig wird. Die neue Funktion des sogenannten „Metadata Re-Warming“ befüllt aktiv den Metadaten-Cache vorab und stellt so sicher, dass die Anwendungsperformance ihren Optimalzustand nach geplanten und ungeplanten Ereignissen schnell wieder erreicht.

AES Brownfield

Mit dem Ziel, die Vorteile der Datenlokalität zu maximieren, führte Nutanix in AOS 5.11 den Autonomous Extent Store™ (AES) ein und brachte damit Metadatenlokalität in seine Architektur. AES teilte die globale Metadatenschicht in eine separate globale Metadatenschicht für logische Attribute und eine lokale Metadatenschicht für die physikalischen Attribute. Das verbesserte die Performance für Anwendungen mit durchgängigen Schreibprozessen bedeutend. Vor AOS 6.0 konnte AES nur auf neu angelegten Clustern (d. h. Greenfield) genutzt werden. Ab sofort werden mit AOS 6.0 bereits existierende Nicht-AES-Container auf Clustern, welche die Anforderungen erfüllen, automatisch zu AES konvertiert. Das ermöglicht Kunden durch einen im Hintergrund ablaufenden Prozess Leistungssteigerungen mit derselben Hardware.

Unterstützung von Plattformen der nächsten Generation für Hybrid-Cloud-Bereitstellungen

Intel Ice Lake und AMD Milan

Nutanix hat die Software-Unterstützung für die nächste Generation von Server-Plattformen, die auf den skalierbaren Prozessoren der dritten Generation von Intel® Xeon® (Ice Lake) basieren, angekündigt. Das bedeutet für Kunden geringere Gesamtbetriebskosten (TCO) im Vergleich zu früheren Plattformgenerationen. Zudem sind eine größere Plattform- und Konfigurationsauswahl für Kunden, eine verbesserte Rechenleistung mit bis zu 42 Prozent mehr Prozessorkernen sowie eine bis zu 33 Prozent höhere In-Host-Memory-Dichte und -Leistung Teil der bemerkenswerten Erweiterungen.

Nutanix hat außerdem die Unterstützung von Prozessoren der AMD-Serie EPYC®-7003 (Milan) zusammen mit seiner OEM-Gerätefamilie — mit HPE ProLiant® DX, der Dell® XC Series und der Lenovo ThinkAgile® HX Series — angekündigt. Die Prozessoren der EPYC-7003-Serie von AMD bieten bis zu 64 Kerne pro Socket, acht Kanäle für DDR4-Speicher und bis zu 19 Prozent Leistungssteigerung pro Kern im Vergleich zur vorherigen Generation.

Resilienz

Reserve-Kapazität für die Wiederherstellung

Die Widgets für die Speicherübersicht und -resilienz vereinfachen Kapazitäts-Monitoring und -Transparenz. Ab sofort gibt es eine Einstellung für die sogenannte “Reserve Rebuild Capacity”. Dabei handelt es sich um eine Reserve-Kapazität für die Wiederherstellung, die auf einem Cluster konfiguriert werden kann, um sicherzustellen, dass im Falle eines Node-Ausfalls genügend Kapazitäten für die Wiederherstellung vorhanden sind. Mit der Konfiguration reserviert der Cluster die Kapazität des größten Nodes innerhalb des Clusters, sodass im Falle eines Node-Ausfalls genügend Platz für die Wiederherstellung und die Rückkehr zur vollen Resilienz vorhanden ist.

Diese Einstellung ist besonders nützlich für Umgebungen mit großen Mengen an geschäftskritischen Daten, kann aber für Umgebungen deaktiviert bleiben, in denen manuelle Eingriffe für die strikte Durchsetzung von Wiederherstellungskapazitäten bevorzugt werden.

Fortschrittsanzeige über den Wiederherstellungsprozess/ETA („Estimated Time for Achievement“)

Zudem wurde das Widget für die Speicherresilienz verbessert, um mehr Einblick in den aktuellen Resilienzstatus des Clusters zu bringen. Ab sofort werden das Fehlertoleranzniveau (FT 1 oder FT 2) und die aktuelle Fehlerdomäne (Rack, Block oder Node) angezeigt. Das Widget gibt nun auch an, ob Änderungen am konfigurierten Zustand beider Werte vorgenommen wurden. Außerdem gibt es eine Detailseite, die Informationen über die Fehlerrobustheit für jede der zugrundeliegenden Komponenten bietet.

Am bedeutendsten ist wahrscheinlich die neu hinzugefügte Fortschrittsanzeige über den Wiederherstellungsprozess. Sie ermöglicht es Administratoren, die verbleibende Zeit bis zur Wiederherstellung der vollen Resilienz im Cluster zu verfolgen. Die Berechnung der Wiederherstellungszeit nutzt verteilte Algorithmen, die eine große Zahl an Faktoren miteinbeziehen — einschließlich der Wiederherstellungsfähigkeit, der Zahl und Geschwindigkeit von einzelnen Laufwerken, der Anzahl der am Wiederherstellungsprozess beteiligten Nodes und sogar der aktuellen E/A-Last auf dem Cluster.

Resilienz-Dashboard für mehrere Cluster

Nutanix-Kunden verwalten ihre globale HCI-Umgebung mit der Managementkonsole Prism Central™, die eine einzige Oberfläche für die Verwaltung unterschiedlicher, geographisch verteilter HCI-Cluster bietet. Das Resilienz-Widget für mehrere Cluster in Prism Central vereint die Funktionalität der Widgets für die Speicherübersicht und -resilienz in einem Dashboard für mehrere Cluster. Das vereinfacht das Monitoring der Kapazitätsauslastung und Resilienz aller Cluster von einem einzigen Ort aus.

Das erleichtert es Administratoren, die Auslastungs- und Resilienzmetriken für ihre verteilten HCI-Bereitstellungen zu überwachen und entsprechend zu handeln. Die Metrikenansicht wurde unter ästhetischen Gesichtspunkten neugestaltet, um die Informationen einfacher verständlich und aussagekräftiger zu machen.

Business Continuity und Disaster Recovery (BCDR)

AHV Metro Availability

BCDR-Angebote waren von Anfang an zentrale Funktionen in AOS. In AOS 6.0 entwickeln wir diese mit der Einführung von AHV® Metro Availability weiter. AHV Metro Availability ist für Anwendungen gedacht, die den AHV-Hypervisor nutzen und für die Vermeidung von Ausfällen sowie die automatische Wiederherstellung während Disaster-Recovery-Ereignissen kein RPO und eine RTO nahe Null erfordern. Diese Funktion nutzt die synchrone Replikation, um geschäftskritische Anwendungen innerhalb 5ms oder weniger Latenzzeit zu synchronisieren. Für die Konfiguration und Nutzung aller Aspekte von AHV Metro Availability beinhaltet Prism Central ab sofort Sicherheitsrichtlinien, Recovery-Pläne und eine Witness-VM für den automatischen Failover während eines ungeplanten Ausfalls. Damit stellen wir Kunden eine vollumfängliche DR-Lösung auf dem AHV-Hypervisor zur Verfügung.

NearSync erweitert auf mehrere Standorte

In der Welt der geschäftskritischen Anwendungen ist eine extrem kurze E/A-Latenzzeit oft entscheidend. In einem solchen Szenario erfordern die strengen Latenzanforderungen von 0-RPO, dass derartige Anwendungen ohne Auswirkungen auf die Latenzzeit geschützt werden. Oftmals müssen solche Anwendungen, die dem Geschäft dienen, auch gegen verschiedenste Ausfälle abgesichert werden. Die Nutanix-NearSync-Replikation auf unterschiedliche Standorte erweitert ab sofort unseren Ansatz der Continuous Data Protection (CDP) über verschiedene Standorte hinweg, um eine zusätzliche Schicht zur Absicherung gegen verschiedene Ausfallereignisse über Standorte hinweg zu bieten.

Überwachung für DR

Die BCDR-Lösungen von Nutanix erstrecken sich jetzt on-premises bis zu multiplen Cloud-Umgebungen ausgeweitet. Die Überwachung von Leap® und Nutanix Clusters™ auf AWS ist für Kunden auf ihrer Reise in die hybride Cloud mit Nutanix zur Priorität geworden. Mit der Version AOS 6.0 haben wir ein Dashboard in Prism Central hinzugefügt, das Einblicke in einige zentrale Leistungsindikatoren rund um den Bereich DR gibt — wie RPO-SLAs über Clouds hinweg, DR-Bereitschaft, Alarme, etc. Mit Einzel-PC-Unterstützung für Leap können Kunden ab sofort auf nur einer Oberfläche alle Monitoring-Funktionalitäten ihrer in verschiedenen Cloud-Umgebungen betriebenen Prism-Element-Bereitstellungen im Blick behalten.

Sicherheit und Netzwerk

Flow Networking

Nutanix macht in AOS 6 Flow™ Networking für Kunden allgemein verfügbar (GA). Diese spannende neue Lösung für das virtuelle Networking war bisher nur einigen wenigen Kunden via „Early Access“ vorbehalten. Flow Networking vereint virtuelle Private Clouds (VPC) und andere virtuelle Netzwerkkonzepte zwischen On-Premises- und Cloud-nativen Workloads, was das hybride Multi-Cloud-Networking erst möglich macht. Flow Networking bietet einen softwaregesteuerten Ansatz für die Vereinfachung der Infrastruktur, was für Endanwender Agilität in die Infrastrukturnutzung und die App- und Workload-Bereitstellung bringt.

AHV-Port-Spiegelung

Im Bereich Netzwerk war eine der von Kunden am meisten nachgefragten Funktionen das Port-Mirroring, das es den Kunden erlaubt, den Datenverkehr auf einem bestimmten Port auf einen anderen Port zu spiegeln, um ihn weiter analysieren zu können. Mit AOS 6.0 führen wir ab sofort Port-Mirroring-Funktionalitäten ein. In dieser allerersten Version des Port-Mirrorings ermöglichen wir es, den Datenverkehr auf einem physischen Port eines Rechen-Hosts auf eine vNIC (virtuelle Netzwerkkarte) einer virtuellen Maschine auf demselben Host zu spiegeln. Wir werden die Port-Mirroring-Funktionalitäten kontinuierlich weiterentwickeln, um mehr Regler für die Selektivität (des zu spiegelnden Datenverkehrs), die Flexibilität (bezüglich des Zielorts der Spiegelung) und die Skalierung der Anzahl der gleichzeitigen Mirroring-Sitzungen hinzuzufügen.

Unterstützung von sekundären IPs und Anbindung von Floating-IPs

Ein weiterer Anwendungsfall und Bedarf unserer Kunden war die Anforderung, mehrere IP-Adressen an eine Netzwerkkarte (NIC) anzubinden, um Lastverteilung, hohe Verfügbarkeit und Failover zu vereinfachen. Diese zusätzlichen IP-Adressen werden oftmals als sekundäre IPs bezeichnet. Mit dieser neuen in AOS 6.0 eingeführten Funktionalität können Kunden ganz einfach externe IP-Adressen Services innerhalb der VPCs (virtuelle Private Clouds) zuordnen, selbst wenn ein Service mehrere Adressen besitzt.

Management und Automatisierung

Verbesserungen für die Erweiterung der Cluster-Funktionalität

Die Cluster-Erweiterung wurde mit AOS 6.0 verbessert, sodass der Endanwender über mehr Kontrolle verfügt. Bisher mussten für die Cluster-Erweiterung einzelne Nodes vorbereitet und dann zum Cluster hinzugefügt werden. Mit AOS 6.0 gibt es ab sofort die Option, diese beiden Vorgänge zu entkoppeln. Kunden können sich dazu entscheiden, zuerst die Nodes vorzubereiten, was die Einrichtung von Host-Networking und die Installation von AOS- und AHV-Versionen einschließt. Danach können sich Kunden dazu entscheiden, den Cluster durch Hinzufügen dieses vorbereiteten Nodes zu erweitern — ein Vorgang, der schnell vonstatten geht.

Unterstützung von Kapazitäts-Runway für Nicht-Nutanix-vCenter

Prism hat KI-Funktionalitäten in seiner X-Fit-Engine, mit deren Nutzung es bisher in der Lage war, Runway-Analysen von CPU, Arbeitsspeicher und Speicher für auf AHV laufende Cluster zu bieten. Mit AOS 5.19 und PC 2020.9 führte Nutanix die Unterstützung für das Monitoring von vCenter-Instanzen ein, was Prism die Fähigkeit verliehen hat, VMs und Hosts von VMware® zu überwachen, selbst wenn diese nicht auf einer Nutanix-HCI betrieben werden. Darauf aufbauend kann Nutanix mit AOS 6.0 und PC 2021.5 ab sofort durch die Nutzung derselben Algorithmen in der X-Fit-Engine und die Zuordnung selbiger zu den entsprechenden Metriken vom v-Center-Server auch einen Kapazitäts-Runway für vCenter-Server® zur Verfügung stellen. Das erlaubt es Kunden ab sofort, Prism und seine einmaligen KI-Funktionalitäten für das Monitoring ihrer gesamten virtualisierten Infrastruktur zu nutzen, selbst wenn ein Teil davon auf einer Legacy-Infrastruktur verbleibt.

Heute noch aktualisieren

Um von diesen neuen Funktionalitäten profitieren zu können, aktualisieren Sie ihren Cluster ganz einfach mit dem Tool „Nutanix Life Cycle Manager™“ (LCM) auf AOS 6 und lesen Sie in den AOS 6 Release Notes alles über die Neuerungen. Um noch mehr Details zum Nutanix-Portfolio — und auch im Speziellen zu diesen Funktionen — zu erfahren, sehen Sie sich die Aufzeichnungen der Breakout-Sessions und Keynotes von der weltweiten Kunden- und Partnerkonferenz Nutanix .NEXT 2021 an.