Daten reduzieren beim Backup und der Archivierung

Deduplizierung: Speicherplatz statt Redundanz

Zwei DeDup-Strategien

Zwei grundlegende Ansätze sind bei DeDup-Lösungen möglich:

  • In-Band-Lösung

  • Out-of-Band-Lösung

Zur ersten Kategorie zählt auch die verzögerte Variante „Delayed-In-Band“, bei der die Daten erst nativ auf der VTL landen und dann nach einer kurzen Zeitverzögerung dedupliziert beziehungsweise für eine Deduplizierung vorgemerkt werden. Bei Out-of-Band arbeitet der Deduplizierungsprozess autonom, das heißt beispielsweise ein leistungsstärkerer Server analysiert die Objekte der VTL und eliminiert dann unabhängig vom Backup-Prozess Redundanzen.

Transparent: Für den Backup-Client mit dem dort laufenden Agent ist es ein transparentes Backup-Verfahren, bei dem die zu sichernden Objekte wie ohne DeDup an die Serverbackup-Software gesendet werden. Erst auf dem Server erfolgt die Deduplizierung.
Transparent: Für den Backup-Client mit dem dort laufenden Agent ist es ein transparentes Backup-Verfahren, bei dem die zu sichernden Objekte wie ohne DeDup an die Serverbackup-Software gesendet werden. Erst auf dem Server erfolgt die Deduplizierung.

Beim DeDup-Spezialisten Avamar, der von EMC übernommen wurde, kommen Agents auf den Clients und eine Server-Software zum Einsatz. Die Agents senden erst gar keine redundanten Daten an den Server, die Hash-Wert-Generierung erfolgt also bereits verteilt auf den Clients (In-Band). Im Festplatten-Cache auf dem Server landen also keine gleichen Daten mehr. Ohne DeDup können diese Daten laut Aussage von Avamar nun monatelang im Cache gehalten werden. Diese Lösung bedingt den Austausch der Backup-Produkte auf den Clients und dem Server, verteilt aber die Rechenpower auf die Clients.

Clients leisten Vorarbeit: Wird eine DeDup-fähige Software auf dem Client und Server eingesetzt, so kann der Agent auf dem Client bereits die Hash-Wert-Bildung und Fingerprint-Generierung der zu sendenden Objekte lokal durchführen und entlastet so das Netzwerk und den Server.
Clients leisten Vorarbeit: Wird eine DeDup-fähige Software auf dem Client und Server eingesetzt, so kann der Agent auf dem Client bereits die Hash-Wert-Bildung und Fingerprint-Generierung der zu sendenden Objekte lokal durchführen und entlastet so das Netzwerk und den Server.