SSD "Gesundheit"?

vert

New member
Registriert
21 Nov. 2009
Beiträge
359
Wie so ziemlich alles auf der Welt, leben SSDs ja nicht ewig. Nur, wie lang ist nicht ewig, und wie finde ich raus wann das ist?

Mein X1 (3rd gen, Baujahr 2015 oder 2016) hat aktuell öfters mal Hänger (System friert für 3 bis 30 Sekunden völlig ein) macht dann aber weiter wie wenn nix war, auch der System Monitor zeigt nix auffälliges. Jetzt frage ich mich, ist das wieder ein mysteriöser CentOS/fedora/X11/wayland/gnome bug oder zeigt sich da dass Alter des Systems?

tlp-stat hat ein paar Dinge die für mich etwas gen letzteres Zeigen:

Code:
SMART info:
      9 Power_On_Hours            =     9073 [h]
     12 Power_Cycle_Count         =    10015 
    177 Wear_Leveling_Count       =       87 [%]
    178 Used_Rsvd_Blk_Cnt_Chip    =        0 
    179 Used_Rsvd_Blk_Cnt_Tot     =        0 
    180 Unused_Rsvd_Blk_Cnt_Tot   =     4406 
    190 Airflow_Temperature_Cel   =       29 [°C]
    233 Media_Wearout_Indicator   =      199 [%]

Ich finde bei Samsung kein Spec-sheet für die Platte, aber zumindest die Laufzeit sollte kein Problem sein, aber wear leveling bin ich wohl schon recht hoch? Und Media Wearout 199%! Oder ist das ein Platzhalter? smartctl bin ich überall noch weit über dem threshold, bin also etwas verwirrt.
 
Gehe mal nicht davon aus dass das die SSD ist. Bei einem tatsächlichen Plattenproblem (HDD oder SSD) friert das System zwar auch ein, fängt sich aber nicht wieder nach 30 Sek. 30 Sek. SSD-Timeout wäre ein dicker fetter Hardwarefehler der sich auch im Log finden lassen würde. Ich tippe auf Software.

Wear Leveling Count heißt übrigens gar nichts. Das nimmt nur die bereits geschriebenen TB und zieht sie von den TBW ab. Bei einer SSD die auf 300 TBW Garantie hat, hättest du mit deinem Wert beispielsweise ~40 TB geschrieben. Das ist alles. Und die garantierten TBW liegen nochmal deutlich unter den TBW, die die SSD tatsächlich ab kann. Ich erinnere mich an eine Pressemitteilung von Samsung, dernach ihr damals neuer 64-Layer NAND "7.000-20.000 write cycles for Samsung 64-layer 3D TLC" ab kann, was 12-33 mal höher lag als die für die 860 Evo garantierten TBW.
 
Zuletzt bearbeitet:
Gib doch mal free oder top ein nachdem ein Hänger passiert ist - Ist der Swap angewachsen?

Übrigens:
social-media-backup-day-ho-9905912fe432b747.png
 
Zuletzt bearbeitet:
Wear Leveling Count von 87% habe ich noch bei keiner SSD gesehen. Selbst bei Intel Postville 80 GB und Samsung 830 war das niedrigste um 95%.

Bei einer Enterprise Samsung mit 98 % wähnte ich mich sicher bis der Rechner abstürzte. Bei der Durchsicht der Logdateien wurden einige Zeit lang Lesefehler moniert, beim ersten Schreibfehler war er abgestürzt. Bis zum Absturz war de Rechner allerdings total unauffällig.
 
Wear Leveling Count von 87% habe ich noch bei keiner SSD gesehen. Selbst bei Intel Postville 80 GB und Samsung 830 war das niedrigste um 95%.
Kommt halt immer drauf an, wie sehr die SSDs genutzt wurden. Ich habe hier ein paar Samsung 830er, die bei 1% sind. Einige haben davon auch aufgegeben, wenn ich mich richtig erinnere, aber zumindest zwei Stück laufen hier aktuell noch mit einem Wear Leveling Count von 1% laut SMART und damit einem Wearout von 99% laut Proxmox. Habe gerade mal SMART von einer der SSDs aufgerufen und sie hat halt 188230964989 Total_LBAs_Written, das sind knapp 100TBW - für eine 64GB SSD eine ganze Menge ;) Wenn ich diese Zahlen hier hochrechne: https://www.hardwareluxx.de/index.p...9997-test-samsung-ssd-830-series.html?start=2, dann ist die Lebensdauer theoretisch wohl mit ~58TBW angegeben. Da bin ich schon nicht mehr weit vom doppelten entfernt :D
 
Gib doch mal free oder top ein nachdem ein Hänger passiert ist - Ist der Swap angewachsen?
Screenshot from 2020-10-27 12-03-38.png
Sieht meist so aus, da sollte free oder top auch nix anderes sagen. Die Hänger bei RAM voll sind aber auch anders. Deutlich länger und werden gerne zu komplettabstürzen.
Alle paar Tage mit rsync auf eine externe Platte im Büro und daheim (also quasi off-site) und per syncthing mit dem Büro Desktop synchronisiert.

Ersteres hat aber manchmal wegs mangelnder disziplin manchmal etwas zu große Abstände, und da Büro bald wieder wegfällt suche ich gerade nach Ausreden für einen neuen Rechner der dann wieder einen SD-slot haben sollte…

Wear Leveling Count von 87% habe ich noch bei keiner SSD gesehen. Selbst bei Intel Postville 80 GB und Samsung 830 war das niedrigste um 95%.

Bei einer Enterprise Samsung mit 98 % wähnte ich mich sicher bis der Rechner abstürzte. Bei der Durchsicht der Logdateien wurden einige Zeit lang Lesefehler moniert, beim ersten Schreibfehler war er abgestürzt. Bis zum Absturz war de Rechner allerdings total unauffällig.
Das zählt auch von oben runter? Also 100% = alles gut, 0% = quasi tot?
Also je nach dem wie mans betrachten mag, also eh noch super oder schon kritisch. Mal überlegen.
 
Zuletzt bearbeitet:
Oder absolut nichtssagend bzw. nur für Garantie relevant. Eine SSD stirbt nicht plötzlich an 13% verbrauchtem NAND sondern an Controllerfehlern. Oder nach jahrelangem Hämmern mit Daten wenn der NAND wirklich am Ende ist.

Ich formuliere es mal andersrum: SMART-Werte helfen, in etwa zu peilen wie lange die SSD es noch macht. Plötzliches Versagen kann weder vorhergesehen noch an den SMART-Werten irgendwie abgelesen werden. Es geht da strikt um die Fitness des NAND.
 
Zuletzt bearbeitet:
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben