Drive Snapshot: Hashfile für differentielles Image, wie funktioniert das?

dark_rider

Active member
Registriert
7 Aug. 2008
Beiträge
1.842
Hallo zusammen,

Drive Snapshot, mein favorisierter Imager für Backups, erstellt bei Voll-Images auf Wunsch ein Hashfile, das offenbar den Inhalt des Images beschreibt und mit dem dann bei differentiellen Folge-Images der aktuelle Inhalt der zu sichernden Partition verglichen wird, so dass nur noch die Änderungen seit dem letzten Voll-Image gesichert werden.

Frage: Obwohl ich die Wikipedia-Artikel zu Hashtabellen gelesen habe, verstehe ich noch nicht so recht, wie das nun genau funktioniert. Ist eine Hashtabelle eine Art Prüfsumme (wie z.B. bei 2345 die 4 als letzte Stelle der Quersumme 14), und falls ja, basiert das Verfahren auf Wahrscheinlichkeiten, so dass u.U. eine Änderung nicht erkannt wird, wenn die Prüfziffer zufällig trotz Änderung des Inhaltes gleich bleibt (wie im Beispiel bei 1436, Quersumme hier auch 14), oder ist 100% sichergestellt (was ich hoffe), dass keinerlei Änderung auch nur eines einzigen Bits unbemerkt bleiben kann?
 
Drive snapshot machts wahrscheinlich so, dass in festen Block Größen (alle 2mb?) ein hash errechnet und in der hashfile speichert. Beim zweiten Image wird dann einfach überprüft, ob der hash pro Block überein stimmt und eine Referenz auf das erste Image gelegt. Dadurch hat man alle nötigen Informationen in Image und kann den Block überspringen.
 
Zur Hash-Tabelle: das ist in der Programmierung bei vielen Sprachen ein übliches Konstrukt was häufig für Assoziative Arrays verwendet wird. Wird auch als hashmap bezeichnet. Es wird verwendet um direkt über den key auf eine Stelle im Array zu springen. Der key wird zum hash umgerechnet und existiert ein Eintrag wird der zugehörige gespeicherte wert ausgegeben. Da es bei hashes immer mal zu Kollisionen kommen kann wird der key mit dem in Array gespeicherten verglichen um sicherzustellen das es auch der tatsächlich angeforderte ist. In Beispiel von Assoziativen Arrays passiert das gegenüber den Programmierer transparent.
 
Da der Hashwert kleiner ist als die Originaldaten, sind Kollisionen möglich. (Ich kann halt nicht 100 mögliche Werte eineindeutig in einer Zahl abbilden, die nur 10 Werte annehmen kann.)
Die Algorithmen sind aber in der Regel so gewählt, daß sie die Veränderung einzelner Bytes durchaus bemerken.
 
Danke für Eure Antworten, aber so richtig schlau werde ich daraus bisher noch nicht. Hätte mal jemand ein simples Beispiel zur Verdeutlichung?
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben