Automatisches Backup mit Software vs. Kopie von Hand

Nun ja, ich backupe damit für mich sehr sensible Daten und möchte auf keinen Fall das sich ein Fehler einschließt. Zum Beispiel habe ich zehntausende .xmp-Dateien und viele davon sind zur gleichen Zeit entstanden und haben auch sehr ähnliche Größen da sie nur Metadaten von Bildern enthalten. Wenn dann zufällig der Umstand eintritt das mehrere gleich groß sind und zur gleichen Zeit entstanden sind, dann könnten es sein das die Bearbeitung der Bilder flöten geht.
Du hast also mehrere gleich große Dateien mit gleichem Dateinamen im gleichen Ordner liegen, die zur selben Zeit entstanden sind?
Ordner und Dateinamen sind ja auch ein Kriterium.
 
Auch wenn ich independence' Denkweise und die damit verbundene (über)vorsichtige Vorgehensweise nachvollziehen kann, so sollte man bedenken, dass bei "Datum und Größe" ja nicht auf Minute und Megabyte, sondern nach dem Prinzip "04.09.2015, 13:18:21, 22.296.103 Bytes" verglichen wird. Und da ist die Wahrscheinlichkeit eines False Positives doch sehr gering...
 
Du hast also mehrere gleich große Dateien mit gleichem Dateinamen im gleichen Ordner liegen, die zur selben Zeit entstanden sind?
Ordner und Dateinamen sind ja auch ein Kriterium.

In der Theorie kann es vorkommen.. Aber da ich keine Lust/Möglichkeit habe es zu prüfen ob denn die Dateien gleich sind gehe ich den vorsichtigen Weg und wähle die andere Option mit dem Vergleich der Dateiinhalte. Wenn die Funktion überflüssig wäre, würde man sie auch nicht anbieten denke ich mir..

Auch wenn ich independence' Denkweise und die damit verbundene (über)vorsichtige Vorgehensweise nachvollziehen kann, so sollte man bedenken, dass bei "Datum und Größe" ja nicht auf Minute und Megabyte, sondern nach dem Prinzip "04.09.2015, 13:18:21, 22.296.103 Bytes" verglichen wird. Und da ist die Wahrscheinlichkeit eines False Positives doch sehr gering...

Ich habe dadurch ja keinen Mehraufwand, ich muss einfach nur länger warten. Natürlich ist die Wahrscheinlichkeit sehr gering, aber ich muss auch gestehen, dass ich mir noch nicht tiefgehende Gedanken gemacht habe wie groß die Wahrscheinlichkeit nun wirklich ist.. Da war die Überlegung eher folgendermaßen: "mmmh, was wähle ich denn nun von den beiden Möglichkeiten aus??? - Ok, mit dem Vergleich der Inhalte habe ich ne höhere Sicherheit das alles passt, dann nehmen wir einfach mal die Option, kostet ja nix außer mehr Rechenzeit..." Die Überlegung hat vielleicht 3 Minuten gedauert.. Also wesentlich kürzer als ich bislang zum Schreiben von diesem Absatz benötigt hab^^
 
Keine Kritik von meiner Seite - ich hätte womöglich genauso entscheiden! :)

Am besten wäre ja eigentlich ein Vergleich nach Datum/Zeit/Größe und nur wenn es da eine Kollision gibt ein gezielter zusätzlicher Vergleich des genauen Dateiinhalts. Die Option gibts aber ja leider nicht, schade! ;)
 
Nach überfliegen und durchsuchen des Topics, scheint noch niemand Allway sync erwhähnt zu haben. Hatte mir vor Jahren ein Kommilitone empfohlen, der dem sogar seine Geschäftsdaten anvertraute. Habe es seitdem - leider nicht regelmäßig genug - genutzt und konnte bis dato keine Fehler feststellen, die nicht auf falscher Benutzung beruht hätten.
 
Hi independence,

du kannst mir viel erzählen, aber bestimmt nicht, dass es Dateien gibt, die absolut genau den gleichen Timestamp aufweisen, auch wenn diese quasi zur "gleichen" Zeit entstanden sind.
Du kannst ganz beruhigt Deine vorsichtige Strategie mit der Überprüfung des Dateiinhaltes aufgeben.

Alternativ einfach immer alle 700GB umkopieren. Dauert auch nicht länger, als die kompletten Dateiinhalte immer zu vergleichen (umkopieren war das falsche Wort..).

Evtl. noch Vergleiche der CRC Hashes der einzelnen Dateien zu Rate ziehen. Kostet allerdings auch ordentlich Rechenzeit (Je nach Größe der Einzeldatei)


@Rollingthunder
Ja Allwaysync wäre auch eine Alternative, kostet allerdings Geld für diese Anzahl an Dateien.
Kunden von uns verwenden diese Software als Bezahlversion und sehr zufrieden damit.
 
Zuletzt bearbeitet:
Hi independence,

du kannst mir viel erzählen, aber bestimmt nicht, dass es Dateien gibt, die absolut genau den gleichen Timestamp aufweisen, auch wenn diese quasi zur "gleichen" Zeit entstanden sind.
Du kannst ganz beruhigt Deine vorsichtige Strategie mit der Überprüfung des Dateiinhaltes aufgeben.

Wie gesagt, ich habe damals bei der Auswahl der Option nicht halb so viel Zeit investiert wie mittlerweile zum Lesen und Schreiben in diesem Thread. Aber dann die Frage an dich:

Warum gibt es dann die Überprüfung nach Dateiinhalten, wenn es deiner Ansicht nach keine Dateien gibt, "die absolut genau den gleichen Timestamp aufweisen"?
 
Es ist mit normalen Mitteln fast unmöglich, den Inhalt einer Datei zu ändern, ohne daß sich der Timestamp ändert. Dazu muß das ändernde Programm tief ins Betriebssystem eingreifen und absichtlich an den normalen Filesystem-Funktionen vorbei die Festplatte ändern.
 
Warum gibt es dann die Überprüfung nach Dateiinhalten, wenn es deiner Ansicht nach keine Dateien gibt, "die absolut genau den gleichen Timestamp aufweisen"?
Das solltest Du die Entwickler und nicht mich fragen......Vielleicht hatten Sie noch Spare Time und wussten nicht was sie sonst hätten tun können in Ihrer Freizeit.
 
Zuletzt bearbeitet:
Aber dann die Frage an dich: Warum gibt es dann die Überprüfung nach Dateiinhalten, wenn es deiner Ansicht nach keine Dateien gibt, "die absolut genau den gleichen Timestamp aufweisen"?
Das solltest Du die Entwickler und nicht mich fragen......Vielleicht hatten Sie noch Spare Time und wussten nicht was sie sonst hätten tun können in Ihrer Freizeit.

Aus der FreeFileSync-Hilfe:
[h=3]II. Compare by File content[/h]Two files with the same name are marked as equal if and only if they have the same content. This option is more useful for consistency checks rather than backup operations since it is naturally slower. The file modification time is not taken into account at all.



Weiß zufällig jemand, wie genau der Timestamp tatsächlich ist? Auf die Sekunde, Millisekunde, Mikro... Nano... Piko...?
Das würde je nachdem ja schon einen Unterschied im Hinblick auf die Wahrscheinlichkeit von Dateien mit demselben Zeitstempel machen.
 
Zum Vergleich gehört ja auch noch der Dateiname und meistens auch das Verzechnis. Daher ist es eigentlich garnicht möglich, das es hier eine Überschneidung gibt.
 
Also ich nutze ja auch FreeFileSync gerne und ausgiebig. Und in der Regel nur mit dem Abgleich über Datum & Größe.

Aber das geht beispielsweise nicht bei den TrueCrypt Kontainern in meinem Büroordner. Was aber eher für TrueCrypt spricht.
Der Abgleich über Dateiinhalt findet jedoch die geänderten Kontainer.

Weitere "Dateifornate" wo das eine Rolle spielt kenne ich jedoch nicht.
 
In der Theorie kann es vorkommen..
Welches gebräuchliche Dateisystem erlaubt zwei Dateien mit identischem Namen im selben Ordner?


Weiß zufällig jemand, wie genau der Timestamp tatsächlich ist? Auf die Sekunde, Millisekunde, Mikro... Nano... Piko...?
Hängt vom Dateisystem ab. FAT32 ist recht ungenau, ext3 1 Sekunde, ext4 1 Nanosekunde, NTFS war m.E. auch auf der genaueren Seite.
Wäre ich auf Arbeit, könnte ich dir eine Liste geben. Ei Kollege hatte das mal für einen Vortrag zusammen gesucht.
 
Hängt vom Dateisystem ab. FAT32 ist recht ungenau, ext3 1 Sekunde, ext4 1 Nanosekunde, NTFS war m.E. auch auf der genaueren Seite.
Wäre ich auf Arbeit, könnte ich dir eine Liste geben. Ei Kollege hatte das mal für einen Vortrag zusammen gesucht.

Wäre cool, wenn du das bei Gelegenheit nachreichen könntest. Würde mich mal interessieren!
Hat aber keine Eile und wenn es untergeht, auch nicht so schlimm... :)
 
Welches gebräuchliche Dateisystem erlaubt zwei Dateien mit identischem Namen im selben Ordner?



Hängt vom Dateisystem ab. FAT32 ist recht ungenau, ext3 1 Sekunde, ext4 1 Nanosekunde, NTFS war m.E. auch auf der genaueren Seite.
Wäre ich auf Arbeit, könnte ich dir eine Liste geben. Ei Kollege hatte das mal für einen Vortrag zusammen gesucht.
Wie gesagt.. Wenn es absolut eindeutig ist nach Datum und Größe zu suchen (von dem Dateinamen steht in der FreeFileSync Beschreibung ja auch nichts) dann frage ich mich immer noch wozu die Entwickler das weitere Feature eingebaut haben. Des Weiteren kann ich nur nochmal sagen das ich mir bei der damaligen Wahl keine derart tiefgreifenden Gedanken gemacht habe wie es hier gerade der Fall ist.. Und zusätzlich hat das ja auch nichts mit meiner eigentlich frage mehr zu tun
 
Der Dateiname wird nicht erwähnt, da es beim Vergleich darum geht, eine Datei eines bestimmten Names mit der gleich genannten Datei im Backup zu vergleichen.
Das Feature gibt es für die wenigen Spezialfälle wie z.B. der oben erwähnte Truecrypt-Container.
 
Der Dateiname wird nicht erwähnt, da es beim Vergleich darum geht, eine Datei eines bestimmten Names mit der gleich genannten Datei im Backup zu vergleichen.
Das Feature gibt es für die wenigen Spezialfälle wie z.B. der oben erwähnte Truecrypt-Container.

Na also. Und woher weißt du dann, dass einer dieser Spezialfälle nicht bei mir vorhanden ist? Schließlich scheinst du ja auch nicht alle Spezialfälle zu kennen bei denen dieses Feature sinnvoll ist, oder etwa doch?!
Bei den zu sichernden Daten handelt es sich um jahrelang angesammeltes Material in mehreren 100.000 Dateien. Und da ich keine Lust mir über jede einzelne Datei Gedanken zu machen ob denn nun der Vergleich "Datum und Größe" ausreicht habe ich diese Variante gewählt um mit allergrößter Sicherheit ein absolut völlständiges Backup zu erhalten.
 
Ich muss das Thema nochmal hochholen..
Ich mache teilweise Backups, welche dann mehrere Monate oder auch mal länger als ein Jahr nicht angerührt werden. Jetzt würde ich aber gerne mal meinen aktuellen Datenbestand überprüfen und irgendwie automatisiert nachschauen, ob denn alle Files/Daten/Bilder/Dokumente auch funktionieren und sich öffnen lassen. Natürlich könnte ich jetzt mehrere 100.000 Dateien manuell öffnen, aber das ist mir doch etwas zu viel Aufwand. Gibt es eine Software, welche die Datenintegrität von vielen Dateien überprüft? Hintergrund des ganzen wäre nämlich, dass ich dann die alten Backupfiles (ca 1 Jahr alt) löschen könnte und neue Backups vom aktuellen Datenbestand machen kann und diese dann "langzeitarchiviere".

Danke
 
Wie lange es dauert, kommt natürlich auch auf die Größe der Dateien an, aber sonst kann man sagen: ja, das ist denke ich die einzig sinnvolle Lösung.
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben