Eigentlich müsste es "4-3-1" heißen, denn um das Offsite-Backup zu aktualisieren muss ich es vorübergehend aus seiner Backuprolle entnehmen:-> Daher: 3-2-1-Regel bei Backups betrachten - das bedeutet: 3 Kopien der Daten (1x original, 2x Backup) auf 2 unterschiedlichen Medien (z.B. original auf SSD, Backups auf HDDs), davon 1 an einem anderen Ort (also mindestens eines der beiden Backups physisch getrennt an einem anderen Ort vom Original oder anderen Backup aufbewahren, z.B. in der Cloud oder bei den Eltern, ...)
Ja, das ist dann äquivalent zum Fall "2x Off-Site-Backup ohne On-Site-Backup".Wenn ich die Regel einhalten will, muss ich also stattdessen das zweite Backup mit zu meinen Eltern nehmen. Dann sind Originaldaten und Backups weiterhin an zwei unterschiedlichen Orten. Im Anschluss kann ich aber natürlich das ältere der zwei Backups gleich wieder zu mir mitnehmen.
Hier nimmst du an, dass du eine Kompromittierung des Inkrements zuverlässig erkennen kannst. Das ist aber ein Trugschluss. Wenn dein Inkrement zwischen seiner Erstellung und der Übertragung auf das Off-Site-Backup still kompromttiert wird, es also augenscheinlich funktioniert, aber nicht die Daten enthält die du erwartest, dann kompromittierst du damit auch dein Off-Site-Backup. Und da du nie direkt zwischen Arbeitsdaten und Off-Site-Backup direkt prüfst, sondern immer über den Mittelsmann des Inkrements, fällt das möglicherweise nie auf.Während ich also ein Inkrement mit zu meinen Eltern nehme, habe ich keinen SPOF, da das Backup bei meinen Eltern ja trotzdem erst einmal noch okay ist, nur halt nicht mehr brandaktuell. Kommt mein Inkrement unterwegs weg, habe ich immer noch das ältere Backup bei meinen Eltern und das aktuellere Backup bei mir. 3-2-1 wird dabei nicht verletzt, und da das Inkrement kein eigenes Backup ist, bin ich auch nicht bei 4-3-1, sondern immer noch bei 3-2-1.
Hatte da mal einen Bekannten, der jahrelang seine Backups auf DAT-Bänder sicherte, jede Woche. Nach ein paar Jahren brauchte er dann eine Datei - und stellte zu seinem Entsetzen fest, dass die Bänder recht jungräulich warenUnd da du nie direkt zwischen Arbeitsdaten und Off-Site-Backup direkt prüfst, sondern immer über den Mittelsmann des Inkrements, fällt das möglicherweise nie auf.
Ja, für den kurzen Moment hast du beide Backups an einem Ort, bis du den alten Datenträger wieder mitnimmst. Ist aber ja nicht schlimm, schließlich hast du deine Originaldaten an einem anderen Ort und damit die Georedundanz gewahrt.Ja, das ist dann äquivalent zum Fall "2x Off-Site-Backup ohne On-Site-Backup".
Also erstens ist die Kompromittierung eines Backups kein Problem von Inkrementen, sondern von allen Backups und allen Backupformen, daher sollte man dafür immer Vorkehrungen treffen (z.B. durch Checksummen) und zweitens prüfst du nie gegen die Arbeitsdaten, denn die können sich seit der Erstellung des Backups längst verändert haben. Daher ist für deinen angenommenen Fall mit dem Inkrement kein Unterschied zu machen. Entweder der Fall würde auch beim Vollbackup auftreten und nicht nur beim Inkrement oder dein Inkrement ist genau so "geschützt", dass du auch dort Veränderungen erkennen würdest.Hier nimmst du an, dass du eine Kompromittierung des Inkrements zuverlässig erkennen kannst. Das ist aber ein Trugschluss. Wenn dein Inkrement zwischen seiner Erstellung und der Übertragung auf das Off-Site-Backup still kompromttiert wird, es also augenscheinlich funktioniert, aber nicht die Daten enthält die du erwartest, dann kompromittierst du damit auch dein Off-Site-Backup. Und da du nie direkt zwischen Arbeitsdaten und Off-Site-Backup direkt prüfst, sondern immer über den Mittelsmann des Inkrements, fällt das möglicherweise nie auf. Ersetzt du das Inkrement hingegen durch ein weiteres Vollbackup, dann fällt dir die Kompromittierung spätestens beim übernächsten Austausch auf, wenn du das dann zurückgetauschte Vollbackup direkt mit deinen Arbeitsdaten abgleichst.
Gut, klar, wobei das bei ausreichenden Checks (Checksummen) nicht so kritisch ist. Backups vom Backup ziehen ergibt aber durchaus trotzdem Sinn und wird auch häufig gemacht, nämlich um alte Backups auf alten Backupmedien mal auf "frische" Medien umzukopieren. Damit nicht irgendwann auffällt, dass die 10 Jahre im Schrank liegende HDD gar nicht mehr anläuft, die 5 Jahre im Schrank liegende SSD alle Daten vergessen hat (Flash-Speicher ist ohne Stromversorgung langfrisitig ggf. flüchtig!) oder die Bandsicherung gar nicht mehr eingelesen werden kann, weil das Laufwerk den alten LTO-Standard gar nicht mehr liest.Fazit:
Backups immer direkt von den Arbeitsdaten ziehen, nie von einem anderen Backup, denn Backupfehler pflanzen sich fort!
Die Nutzung von Inkrementen führt aber eine zusätzliche Fehlerquelle ein. Wenn ich von meinen Arbeitsdaten ein Inkrement ziehe um es auf mein Off-Site-Backup zu übertragen, dann habe ich ein Backup, aber zwei potenziell fehlerbehaftete Kopiervorgänge (Arbeitsdaten -> Inkrement, Inkrement -> Backup). Ersetze ich das Inkrement hingegen durch ein zweites Vollbackup, welches ich jeweils gegen das erste Backup austausche, dann habe ich immer noch zwei Kopiervorgänge (Arbeitsdaten -> Backup1, Arbeitsdaten -> Backup2), aber auch zwei Backups.Also erstens ist die Kompromittierung eines Backups kein Problem von Inkrementen, sondern von allen Backups und allen Backupformen, daher sollte man dafür immer Vorkehrungen treffen (z.B. durch Checksummen)
Den Diff zwischen Arbeitsdaten und Backup kann ich aber einfach auf Plausibilität prüfen. Hänge ich ein Inkrement dazwischen, dann verdreifacht sich der Aufwand, denn ich muss nun 1. Arbeitsdaten gegen Inkrement, 2. Inkrement nach der Erstellung aus Arbeitsdaten gegen Inkrement vor der Übertragung auf's Backup und 3. Inkrement gegen Backup prüfen.und zweitens prüfst du nie gegen die Arbeitsdaten, denn die können sich seit der Erstellung des Backups längst verändert haben.
Ja, aber das ist dann eben kein Backup der "echten" Arbeitsdaten sondern ein Backup vom Backup, mit allen im Quellbackup enthaltenen Fehlern.Backups vom Backup ziehen ergibt aber durchaus trotzdem Sinn und wird auch häufig gemacht, nämlich um alte Backups auf alten Backupmedien mal auf "frische" Medien umzukopieren.
Mein Inkrement kopiere ich aber niemals ins Backup (das Backup bleibt dabei unangetastet!), sondern lege es zusätzlich ab. Das Backup bleibt so wie es ist. Okay, ich kann natürlich die gleiche externe HDD auch für's Inkrement nutzen. Aber auch dann gilt: Wenn ich Checksummen nutze, dann merke ich, falls beim Kopiervorgang etwas kaputt geht, dann kann mir der zusätzliche Kopiervorgang egal sein.Die Nutzung von Inkrementen führt aber eine zusätzliche Fehlerquelle ein. Wenn ich von meinen Arbeitsdaten ein Inkrement ziehe um es auf mein Off-Site-Backup zu übertragen, dann habe ich ein Backup, aber zwei potenziell fehlerbehaftete Kopiervorgänge (Arbeitsdaten -> Inkrement, Inkrement -> Backup). Ersetze ich das Inkrement hingegen durch ein zweites Vollbackup, welches ich jeweils gegen das erste Backup austausche, dann habe ich immer noch zwei Kopiervorgänge (Arbeitsdaten -> Backup1, Arbeitsdaten -> Backup2), aber auch zwei Backups.
Das ist aber alles andere als kostenlos. Ein Vollbackup dauert in der Regel deutlich länger und braucht deutlich mehr Platz als ein Inkrement. Deswegen macht man ja gerade inkrementelle Backups, das ist gängige Praxis.Durch die Nutzung eines zweiten Vollbackups statt eines Inkrements kann ich also praktisch kostenlos (im Sinne des Aufwands) die Redundanz um N+1 erhöhen. Ich finde das ist ein echtes Schnäppchen.
Nochmal: Man testet sein Backup in der Regel nie gegen die aktuellen Arbeitsdaten. Wenn überhaupt dann teste ich gegen den dafür erstellten unveränderlichen Snapshot, aber in der Regel erstelle ich beim Backup Checksummen (dafür sind sie da...) und dann prüfe ich später mein Backup nur noch gegen die Checksummen. Und dann habe ich keinen wirklichen Zusatzaufwand durch Inkremente.Den Diff zwischen Arbeitsdaten und Backup kann ich aber einfach auf Plausibilität prüfen. Hänge ich ein Inkrement dazwischen, dann verdreifacht sich der Aufwand, denn ich muss nun 1. Arbeitsdaten gegen Inkrement, 2. Inkrement nach der Erstellung aus Arbeitsdaten gegen Inkrement vor der Übertragung auf's Backup und 3. Inkrement gegen Backup prüfen.
Deshalb: Checksummen.Ja, aber das ist dann eben kein Backup der "echten" Arbeitsdaten sondern ein Backup vom Backup, mit allen im Quellbackup enthaltenen Fehlern.
Deshalb: Checksummen.Das kann man machen und es gibt gute Gründe das zu tun, aber man sollte sich eben des Details bewusst sein, dass es eine Kopie einer Kopie ist. Das bedeutet im einfachsten Fall erhöhten Prüfaufwand (der sich aber gegenüber einem erneuten Backup aus Arbeitsdaten lohnen kann), im schlimmsten Fall bedeutet es stillen Datenverlust.
Ich fürchte, wir reden aneinander vorbei, was die Begriffe "Inkrement" und "Vollbackup" angeht. Du meinst den kompletten Vorgang eines inkrementellen Backups, bei dem du das vollständige Backup mit den Arbeitsdaten vergleichst und die Differenz zusätzlich zum vollständigen Backup ablegst. Was das angeht, stimme ich dir zu. Dann kannst du direkt Vergleiche zwischen Arbeitsdaten und Backup anstellen, denn es gibt keine räumliche Trennung, die du überbrücken musst.Mein Inkrement kopiere ich aber niemals ins Backup (das Backup bleibt dabei unangetastet!), sondern lege es zusätzlich ab.
Ja, das mit den Snapshots ist klar. Aber wie überprüfst du, ob ein Diff, das du von A nach B transportierst um dein Off-Site-Backup zu aktualisieren, intakt ist? Klar, du kannst noch an der Quelle nach der Erstellung des Diffs dessen Checksumme ermitteln und die am Ziel gegenprüfen, bevor du das Diff auf dein Backup anwendest. Aber wie stellst du sicher, dass das Diff nicht schon während der Ermittelung der Checksumme an der Quelle defekt war oder dass während des Updates des Backups am Ziel etwas schief geht?Nochmal: Man testet sein Backup in der Regel nie gegen die aktuellen Arbeitsdaten. Wenn überhaupt dann teste ich gegen den dafür erstellten unveränderlichen Snapshot, aber in der Regel erstelle ich beim Backup Checksummen (dafür sind sie da...) und dann prüfe ich später mein Backup nur noch gegen die Checksummen.
Mit welcher Software kann ich denn (unter Win) solche Checksummen relativ bequem erstellen und überprüfen?Nochmal: Man testet sein Backup in der Regel nie gegen die aktuellen Arbeitsdaten. Wenn überhaupt dann teste ich gegen den dafür erstellten unveränderlichen Snapshot, aber in der Regel erstelle ich beim Backup Checksummen (dafür sind sie da...) und dann prüfe ich später mein Backup nur noch gegen die Checksummen. Und dann habe ich keinen wirklichen Zusatzaufwand durch Inkremente.
So viel klarer wird es nicht. Ich würde sagen: Entweder machst du ein (erneutes) Vollbackup, das nimmst du mit und legst es irgendwo anders ab. Oder du machst (nachträglich) ein inkrementelles Backup und legst es zusätzlich zum Vollbackup ab.Ich fürchte, wir reden aneinander vorbei, was die Begriffe "Inkrement" und "Vollbackup" angeht. Du meinst den kompletten Vorgang eines inkrementellen Backups, bei dem du das vollständige Backup mit den Arbeitsdaten vergleichst und die Differenz zusätzlich zum vollständigen Backup ablegst. Was das angeht, stimme ich dir zu. Dann kannst du direkt Vergleiche zwischen Arbeitsdaten und Backup anstellen, denn es gibt keine räumliche Trennung, die du überbrücken musst.
Ich meinte mit "Inkrement" bisher nur die Differenz zwischen zwei Datenständen, also das was du letztendlich auf einem eher kleinen Austauschdatenträger als Brücke von A nach B bewegst um ein Off-Site-Backup zu aktualisieren. Der Begriff "Inkrement" war hier vielleicht schlecht gewählt und "Vollbackup" war sicher eine unkluge Verkürzung für "vollständiges Backup" im Sinne einer kompletten Kopie aller Daten. Lies meine bisherigen Beiträge nochmal mit 's/Inkrement/Diff/g' und 's/Vollbackup/vollständiges Backup/g', dann dürfte klarer werden, was ich meine!
Die Integrität eines Backups sollte immer gewahrt sein. Deshalb wendet man auch kein Diff auf einem Backup an. Man legt es zusätzlich ab.Ja, das mit den Snapshots ist klar. Aber wie überprüfst du, ob ein Diff, das du von A nach B transportierst um dein Off-Site-Backup zu aktualisieren, intakt ist? Klar, du kannst noch an der Quelle nach der Erstellung des Diffs dessen Checksumme ermitteln und die am Ziel gegenprüfen, bevor du das Diff auf dein Backup anwendest.
Klag kann ein Diff/Inkrement (und genau so auch ein Vollbackup!) schon bei der Erstellung kaputt gehen. Dann bringt mir die Checksumme vom Diff/Vollbackup nichts. In der Regel bietet die verwendete Backup-Software dafür aber nochmal Möglichkeiten an. Zum Beispiel indem sie den Snapshot der Daten vorhält und das Backup/Diff nochmal gegenprüft (in der Regel in dem Metadaten und/oder Checksummen verglichen werden, ggf. aber auch vollständiger Abgleich). Wenn das passt, sind auch eventuelle Checksummen der Einzeldateien/-blöcke im Backup sowie die Checksumme des gesamten Backupcontainers gültig.Aber wie stellst du sicher, dass das Diff nicht schon während der Ermittelung der Checksumme an der Quelle defekt war
Nein, s.o., Backups werden nicht nachträglich verändert! Entweder überschrieben und somit durch ein neues Backup ersetzt oder ein Inkrement zusätzlich abgelegt.oder dass während des Updates des Backups am Ziel etwas schief geht?
Dann erstelle ich es halt nochmal. Wie willst du es sonst machen? Falls das auch wieder fehlschlägt, habe ich ein ganz anderes Problem, zum Beispiel einen Hardwareschaden. Dann muss ich halt im Notfall das zweite noch vorhandene Backup bemühen. Deswegen macht man ja zwei Backups/Kopien der Originaldaten. Damit selbst im Falle eines kaputten Backups der Verlust der Originaldaten kein Problem ist, dann ist immer noch die dritte Kopie (Backup Nr. 2) da.Natürlich kannst du hinterher überprüfen, ob die Checksummen von Quelle und Ziel übereinstimmen, aber wenn sie nicht stimmen, dann ist das Kind in den Brunnen gefallen und dein Backup kaputt.
Richtig, es sei denn ich will inkrementelle Backups machen, damit ich nicht so riesige Datenmengen transportieren muss.Auch ein von A nach B transportiertes vollständiges Backup (das durchaus inkrementell erstellt sein kann, aber eben alle Daten enthält und nicht nur das Diff) kann Schaden nehmen, aber wenn du ein zweites vollständiges Backup hast, dann ist wenigstens das noch intakt. Und wenn du die beiden vollständigen Backups jeweils im Wechsel physisch austauschst, dan brauchst du keine Diffs mehr hin- und hertransportieren, und sie fallen als mögliche Fehlerquelle weg.
Such dir was aus. In der Regel übernimmt deine Backup-Software das schon für dich oder bietet es optional an. Ansonsten:Mit welcher Software kann ich denn (unter Win) solche Checksummen relativ bequem erstellen und überprüfen?
Hash-Kollisionen, vor allem zufällige, sind aber extremst selten - je nach Hash-Algorithmus. Klar, bei Algorithmen wie Fletcher ist die Wahrscheinlichkeit deutlich höher, aber die Wahrscheinlichkeit, dass man dadurch eine zufällig veränderte Datei nicht erkennt, dürfte auch trotzdem fast infinitesimal klein sein. Mit MD5 wird's noch unwahrscheinlicher, bei SHA256/SHA512 brauchen wir uns darüber wohl nicht mehr zu unterhalten.... aber immer dran denken: Indentische Prüfsummen heiß nicht identische Files - nur hohe Wahrscheinlichkeit, dass die Files identisch sind.
Nur wenn Backup und Quelldateien beide am gleichen Ort zur gleichen Zeit vorliegen. Mit einem Off-site-Backup ist der Check deutlich leichter, wenn man gegen Hashes prüft. Auch im Desaster-Fall kann man so das Backup bei der Wiederherstellung nochmal checken und so sicherstellen, dass die Daten wiederhergestellt werden, die man ins Backup geschrieben hat. Und falls man dabei feststellt, dass das Backup einen Fehler hat, kann man immer noch z.B. auf das zweite Backup zurückgreifen und die betroffene Datei (oder alles) aus diesem wiederherstellen.Und wenn du nicht die Hashes in einem File ablegst und dann die Hashes der "neuen" Files gegen diese gespeicherten Hashes prüfst kkannst du genau so gut einen1:1 Vergleich der Files machen.
Das ist nicht in jedem Fall praktikabel. Ich habe ca. 5TB zu sichernder Daten. Die im Falle eines Verlustes der Arbeitsdaten wiederherstellen zu können ist wichtig, daher das Backup. Die Historie ist aber eher wenig interessant. Hätte ich die mitgesichert, dann wäre mein Backup über 1PB groß.Nein, s.o., Backups werden nicht nachträglich verändert! Entweder überschrieben und somit durch ein neues Backup ersetzt oder ein Inkrement zusätzlich abgelegt.
Womit sich dann natürlich gleich die Frage stellt, warum Kompressionsprogramme so schreklich ineffizient sind, wenn es genügt, den Hashwert zu speichern und bei einem externen Provider aka google einfach nach dem dazu passenden Datenblock zu suchen ... IMO gibt es dazu auch eine Applikation bei besagter Firma.Mit MD5 wird's noch unwahrscheinlicher, bei SHA256/SHA512 brauchen wir uns darüber wohl nicht mehr zu unterhalten.
Natürlich ist das praktikabel. Niemand hat gesagt, dass du unbegrenzt lange alle Versionen aufbewahren musst. Was du an Historie benötigst und wie lange deine Backups zurückreichen müssen, kannst nur du entscheiden. 5TB an zu sichernden Daten ist jetzt ja noch nicht gigantisch viel. Wie kommst du außerdem auf 1PB? Das wäre 200x 5TB, entspricht also 200 Vollbackups oder der Aufbewahrung von 2000 zusätzlichen Inkrementen, sofern sich bei jedem Inkrement 500GB (10%) der Daten verändert haben. Beides ergibt irgendwie keinen Sinn.Das ist nicht in jedem Fall praktikabel. Ich habe ca. 5TB zu sichernder Daten. Die im Falle eines Verlustes der Arbeitsdaten wiederherstellen zu können ist wichtig, daher das Backup. Die Historie ist aber eher wenig interessant. Hätte ich die mitgesichert, dann wäre mein Backup über 1PB groß.
Das hat mehrere Gründe.Womit sich dann natürlich gleich die Frage stellt, warum Kompressionsprogramme so schreklich ineffizient sind, wenn es genügt, den Hashwert zu speichern und bei einem externen Provider aka google einfach nach dem dazu passenden Datenblock zu suchen ... IMO gibt es dazu auch eine Applikation bei besagter Firma.