Hallo Zusammen,
heute möchte ich euch den Global File Cache von NetApp vorstellen. Das Produkt ist recht neu im NetApp Universum allerdings ist die Technologie sehr bewährt. Der Global File Cache kurz GFC ist aus der Übernahme von Talon durch NetApp Anfang 2020 entstanden.
Nachdem GFC ausschließlich für NetApp´s eigene Cloudangebote wie Azure NetApp Files (ANF), Cloud Volumes ONTAP (CVO) und Cloud Volume Services (CVS) angeboten wurde, steht der Global File Cache nun auch wieder für ON-premises Installationen zur Verfügung.
Zunächst einmal die Frage… Was ist GFC?
Vereinfacht gesagt ist der Global File Cache ein Stück Software, welche sich als Caching Instanz in Eure File-Services hängt. Dabei ist es egal ob euer Haupt File-Server on-premises, in Azure NetApp Files, Cloud Volumes ONTAP oder Cloud Volumes Services liegt. Die Software besteht aus einer Core Instanz und 1+n Edge Instanzen.
Die Core Instanz befindet sich bei eurem Haupt-File-Server (egal ob dieser sich in der Cloud oder on-premises befindet). Die Edge Instanzen werden an Euren Außen Lokationen installiert.
Wie funktioniert der Global File Cache?
Über die Core Instanz wird den Benutzern ein Global Namespace bereitgestellt. Die Benutzer navigieren wie gewohnt in ihrem File-Share, starten “Öffnungs-Anforderungen” und werden authentifiziert. Die Core Instanz ermöglicht dann die User-Session, öffnet und Locked die Datei zentral. Daten die bisher an einer Aussenlokation noch nicht geöffnet wurden, werden von der Core Instanz zur Edge Instanz gestreamed. Oft benutzte Dateien werden im lokalen Cache der Edge Instanz vorgehalten und werden lokal aus diesem Cache bedient.
Wenn ein Benutzer aus einer anderen Lokation nun versucht eine Datei zu Öffnen, die bereits durch einen anderen Benutzer geöffnet ist, so erhält er eine Meldung, dass die Datei in Benutzung ist.
Der Vorteil hierbei ist ganz klar, das aktive File-Locking. Dadurch kommt es nicht mehr zu Duplikaten oder mehreren Versionen eines Dokumentes. Die Dateien existieren also überall auf der Welt nur ein Mal und zwar in der Zentralen Instanz. Beim Arbeiten mit einer Datei in einer Edge Lokation werden nur die geänderten Blöcke zurück zur Core Instanz übertragen.
Diese Verhaltensweise macht, neben anderen Mechanismen, den Global File Cache an Außen Lokationen extrem schnell.
„Ich hab schon ne Riverbed ausprobiert, hat auch nix gebracht. Warum soll GFC jetzt helfen?“
Nunja… Riverbed macht eine Netzwerkoptimierung. Kümmert sich aber nicht um „Storage“ ;). Hier setzt der Global File Cache an.
Bevor ich zum Thema Performance noch mehr schreibe… Seht selbst im Video. Zuerst kopiere ich eine 390 MB Datei „normal“ von meinem File Server auf meinen Desktop (ca. 15MB/s). Danach Kopiere ich vom File-Share die gleiche Datei. Diesmal nur mit dem Global File Cache dazwischen (ca. 370MB/s). BÄÄM!
Wer braucht den Global File Cache?
Aus meiner Sicht eigentlich jedes Unternehmen mit zentralen File-Services auf die von Außen Lokationen zugegriffen wird. Für die Unternehmen, die den Kampf gegen Latenz und Duplikate aufgegeben haben und Ihre File-Services an mehreren Lokationen lokal vorhalten kann der GFC eine geniale Lösung sein, um die File-Services zu zentralisieren und zu konsolidieren.
Bei Fragen kommt gerne auf mich zu.
Beste Grüße
DerSchmitz
DISCLAIMER: Dieser Beitrag stellt meine persönlichen Beobachtungen dar und ist nicht offiziell durch NetApp oder andere autorisiert. Fehlinterpretationen oder Missverständnisse vorbehalten.
Wieder ein mal ein Genuss.
Danke @Eberhard
Hallo Interessanter Beitrag, ich vergleich das gerne mit dem Konkurrenzprodukt Nasuni.
Nasuni ist mit dem File Caching in der USA recht erfolgreichen, kann aber noch mehr.
Wie z.B mehrere User können mit einer Datei arbeiten. Vielleicht mal ein Blick wert 🙂
Hallo Markus, ja das Produkt ist mir ein Begriff. Korrigiere mich, wenn ich falsch liege, aber sie benutzen kein NTFS sodern eine SAMBA Emulation? Und ein Caching machen sie meines Wissens nach auch nicht, sondern ein klassiches Replizieren und Synchronisieren?
Hallo, das mit dem Caching und Sync ist so nicht ganz richtig. Ab der Advanced License hat man die Funktion der Geo-Locality. Es werden sogenannte Edge Ressourcen (pyh. oder VM´s) an die jeweiligen Lokationen eingebracht, die entsprechenden Metadaten des Filesystems vorhalten. Daten landen auf den Edges erst wenn der User dieser auch anfordern. Sync und Replikation ist eine Erweiterung, die es ermöglich, zentral Daten per Job an die jeweiligen Lokationen zu synchronisieren. Bezüglich der NTFS-Thematik kann ich dir leider keine Antwort drauf geben. Da mich das aber selbst interessiert, werde ich das mal recherchieren und bei Bedarf ihr entsprechend ergänzen
Danke für die Klarstellung