Objektspeicher, oft als objektbasierte Speicherung oder objektbasierter Speicher bezeichnet, ist eine Datenspeicherarchitektur, die sich auf die Verwaltung einzelner Objekte statt Dateisystemen und Datenblöcken konzentriert. Ein "Objekt" besteht aus den Daten, den zugehörigen Metadaten und einem einmaligen Identifikator. Der Zugriff auf diese Daten erfolgt unmittelbar über standardisierte APIs (z.B. RESTful APIs) die auf http/https basieren. Leistungsfähige Objektspeichersysteme bietet zudem die Möglichkeit, Daten bei Bedarf in verschiedenen Rechenzentren zu replizieren.
Es gibt unterschiedliche Implementierungsebenen für Objektspeicherung: Geräte-, System- und Schnittstellenebene. Unabhängig von der Ebene kann Object Storage immense Mengen unstrukturierter Daten verarbeiten, die den größten Teil der globalen Daten und Informationsmenge ausmachen.
Im Allgemeinen unterstützt der Einsatz von Objektspeicherung Entwickler, die mit benutzergenerierten Medien umgehen müssen. Aufgrund seiner Fähigkeit, unbeschränkte Mediendateien zu bewältigen und über Petabyte hinaus zu skalieren, ohne die Leistung zu beeinträchtigen, sehen Entwickler und IT-Administratoren in der Objektspeicherung ein nützliches Tool zur Datenspeicherung. Dies gilt insbesondere für stateful Applikationen, die in Kubernetes-Umgebungen laufen und eine persistente, skalierbare Speicherlösung benötigen.
Darüber gibt es Object Storage auch in der Cloud. Nachfolgend finden Sie einige gängige Anbieter von Cloud-basiertem Objektspeicher:
Um Object Storage und ähnliche Speicherarchitekturen zu verstehen, ist ein Blick auf die grundlegende Speicherlösung - die Dateispeicherung - erforderlich. Diese, wie bei den meisten früheren Systemen, einfache, aber begrenzte Lösung organisiert benannte und mit Metadaten versehene Dateien in Ordnern. Die Benennung erleichtert die Navigation und da viele Firmen zentralen Dateizugriff benötigen, eignet sich Dateispeicherung gut für Benutzerverzeichnisse, Abteilungsfreigaben und ähnliche Anwendungen, bei denen eine Dateinavigation im Verzeichnis notwendig ist.
Die Dateispeicherung bietet auch ein hierarchisches System, das bei kleinen Datenmengen einwandfrei funktioniert. Zwar können Sie technisch gesehen viel mehr Dateien erstellen und speichern, aber bei sehr großen Freigaben kann es schwieriger sein, sie später in der Verzeichnisstruktur zu finden. Das Durchsuchen von endlosen Ordnern mit unzähligen Dateien ist weder skalierbar noch effizient.
Mit dieser großen Einschränkung im Hinterkopf ist es an der Zeit, sich mit der nächsten Stufe der Speicherung zu befassen: der Blockspeicherung. In SAN-Architekturen ist es üblich, dass Blockspeicher ein Rohdatenvolumen verarbeiten, das als „Block“ bezeichnet wird und Dateien enthält, die in gleich große Datensegmente aufgeteilt wurden. Von dort aus verwaltet ein Betriebssystem diese Volumes und verwendet sie als individuelle Festplatten. Dadurch ist es Unternehmen möglich, Tools von Drittanbietern zur Verwaltung und Sicherung der Daten einzusetzen.
Blockspeicher bieten in der Regel eine höhere Leistung als Dateispeicher, da Anwendungen auf einem Server direkt auf Daten zugreifen, die in Volumes gespeichert sind, welche aus einer Sammlung von Blöcken auf der Festplatte bestehen. Dadurch entfällt der Overhead von Dateisystemen und deren Verwaltung. Im Gegensatz zu Dateispeicherarchitekturen bestimmen die Datenbanken oder Betriebssysteme, die auf die Volumes zugreifen, die Strategie für die Speicherverwaltung, indem sie Speicherplatz für verschiedene Anwendungen zuweisen, bestimmen, wo die Daten hingehen, und Berechtigungen und Zugriffskontrolle verfolgen.
Im Vergleich dieser beiden Speichersysteme ist die Objektspeicherung für große, ständig wachsende Datenmengen weitaus besser geeignet. Es ist viel einfacher, einen bestimmten Datensatz in einer Object Storage-Architektur zu finden. Da jedes Objekt seine eigene eindeutige Kennzeichnung hat, müssen Sie nicht manuell nach einer Datei innerhalb eines Verzeichnisses suchen. Bei sehr großen Datenmengen bevorzugen Unternehmen in der Regel Objektspeicher, da diese eine bessere Verwaltung in großem Maßstab und geringere Speicherkosten ermöglichen. Architekturen zur Datei- und Blockspeicherung können zwar expandieren, ihre Benutzerfreundlichkeit und Einfachheit leidet jedoch, wenn die Daten bis in den Petabyte-Bereich wachsen.
Sowohl Menschen als auch Maschinen sind für die Erzeugung riesiger Datenmengen verantwortlich, und während einige davon strukturiert sind, ist die große Mehrheit unstrukturiert. Und da unstrukturierte Daten schwierig zu verwalten und zu speichern sind, entscheiden sich Unternehmen für Objektspeichersysteme, um die einzigartigen Herausforderungen zu bewältigen. Zusätzlich liefert die Objektspeicherung:
In der Objektspeicherarchitektur befinden sich die Metadaten direkt im Objekt selbst. Das bedeutet, dass IT-Administratoren keine Datenbanken aufbauen müssen, um Metadaten mit den Objekten zusammenzuführen. Darüber hinaus können benutzerdefinierte Metadaten im Laufe der Zeit erstellt, geändert und hinzugefügt werden. Und was am wichtigsten ist: Durch benutzerdefinierte Metadaten ist die Objektspeicherung im Gegensatz zu ihrem Vorgänger, dem Dateispeicher, einfach zu durchsuchen und zu navigieren.
Der vielleicht offensichtlichste Vorteil bei der Wahl der Objektspeicherung ist ihre unbegrenzte Skalierbarkeit. Unternehmen können je nach Bedarf Nodes hinzufügen und horizontal skalieren. Da die Metadaten beim Objekt verbleiben, ist das System „flach“, was im Vergleich zu traditionellen Speichermethoden eine praktisch unbegrenzte Skalierung ermöglicht.
In Bezug auf die Skalierbarkeit brauchen Unternehmen, die große Datenmengen erzeugen, ein für ihr Budget sinnvolles System. Da sich die Objektspeicherung mühelos skalieren lässt, ist es weitaus kosteneffizienter, Daten in einer Umgebung ohne Volumen- und Sucheinschränkungen zu speichern.
Object Storage ermöglicht eine schnelle und zuverlässige Notfallwiederherstellung von Objektdateien. Denn wenn ein Objekt erstellt wird, wird es automatisch auf 1+ Nodes kopiert. Im Falle einer Katastrophe können Unternehmen sicher sein, dass ihre Daten nicht verloren gehen.
Moderne Objektspeichersysteme bieten robuste Sicherheitsfunktionen. Dazu gehört die serverseitige Verschlüsselung der Daten im Ruhezustand (at rest) sowie während der Übertragung (in transit). In Kombination mit detaillierten Zugriffskontrollen auf der Ebene einzelner Objekte wird sichergestellt, dass die Daten umfassend geschützt sind.
Es wird geschätzt, dass 80 % aller generierten Daten unstrukturiert sind, wobei dieser Prozentsatz wahrscheinlich noch niedrig angesetzt ist. Und bis 2025 werden uns nach Schätzungen von IDC fünfmal so viele Daten vorliegen wie jetzt.
Unternehmen jeder Größe müssen sich mit enormen Mengen ständig wachsender Daten auseinandersetzen, und da das Wachstum – insbesondere das von unstrukturierten Daten – unvorhersehbar sein kann, muss die Speicherlösung ihrer Wahl bei Bedarf schnell und mühelos skaliert werden können. Mit der Objektspeicherung sind Unternehmen nicht nur besser ausgerüstet, um ihre Daten zu speichern – sie sind auch besser in der Lage, ihr Datenmanagement zu optimieren, die Daten zu verwalten, zu durchsuchen und somit für bessere Einblicke zu nutzen.
Die Fähigkeit, große Mengen unstrukturierter Daten zu speichern und mit reichhaltigen Metadaten zu versehen, macht Objektspeicher zur idealen Grundlage für moderne Data Lakes. Unternehmen nutzen Data Lakes, um Rohdaten aus verschiedensten Quellen zu sammeln und für Big-Data-Analysen, maschinelles Lernen und KI-Anwendungen verfügbar zu machen.
Abgesehen davon ist Object Storage anders als ihre Vorgänger Datei- und Blockspeicherung nicht durch eine hierarchische Organisation begrenzt. Vielmehr sind die Daten flach organisiert, was einen übersichtlicheren und leichter verfügbaren Zugriff ermöglicht, als dies andere Speicherarchitekturen bieten können. Außerdem ist diese flache Umgebung viel anpassbarer – durch Zahlen, Attribute und mehr.