Ich hab's ehrlich gesagt noch nie unter Windows probiert. Hast du es mal so probiert?
https://superuser.com/questions/1789164/increasing-number-of-error-log-entries-on-a-nvme-ssd
Unter Linux geht's folgendermaßen: "nvme error-log /dev/nvme0". Bei mir gibt's bei der genannten SSD z.B. 144 Einträge im Log laut SMART. Auslesen lassen sich offenbar "nur" die letzten 64 Fehler. Und die sind besagen alle "Successful Completion: The command completed without errors. The transport type is not indicated or the error is not transport related". smartctl zeigt mir nur den letzten Fehler an und der besagt "Invalid Field in Command".
Irgendwie scheint mein Server also beim Hochfahren immer einen Befehl an die SSD zu schicken, den diese nicht kennt. Daher ist der Error-Log nicht 0, der Fehler aber irrelevant, an dieser Stelle müsste man sich keine Sorgen machen. Wie gesagt, da kann aber eben auch sehr viel ernsthafteres drin stehen. Das muss man sich dann halt mal anschauen. Und/oder nach der Ursache gucken. Hatte auch mal eine SSD, die dort diverse Kommunikationsfehler und andere ziemlich fies klingende Fehler geloggt hatte. Klang erst so, als wenn das was in der SSD übel defekt wäre. Verhalten hat sie sich auch so: Immer wieder Ausfälle. Was war es am Ende? Das SATA-Kabel war zu nah am Lüfter, dieser hatte das Kabel beschädigt und dabei eine Ader durchtrennt, die nun einen Wackelkontakt hatte. Kabel getauscht, SSD lief wieder. Die Fehler im Log blieben aber natürlich - wurden halt nur nicht mehr mehr.
Was ich damit sagen will: Man kann/darf/sollte nicht einfach feste Grenzen ziehen bei den Werten, sondern ggf. im Detail draufschauen.
Und genau, wie
@Ambrosius schon sagte/schrieb, gibt es auch keine allgemeingültige Norm für die Werte. Immer mal wieder beschreiben verschiedene Hersteller die SMART-Werte auch anders als andere. Seagate kodiert bei seinen HDDs z.B. die Anzahl der Lesevorgänge mit im Datenfeld für die "Raw-Read Error-Rate". Dann sehen die Werte astronomisch hoch aus und die Leute denken an Defekte, dabei ist der Wert völlig normal.
Und klar, manchmal (oft?) geben HDDs und SSDs auch auf, obwohl die Werte eigentlich ok sind. Bei Ambrosius klingt es so, als wenn sich der Controller "aufgehängt" hat, als der Fehlerspeicher "übergelaufen" ist. Auf die schnelle finde ich es gerade nicht, aber vor einer Weile gab es auch mal HDDs oder SSDs, die nach x Tagen (1024 Tage? oder so?) ausfielen - außer, man hat rechtzeitig ein Firmware-Update eingespielt. Aber gut, das ist ein anderes Thema.
A pro pos anderes Thema:
@ROB87 wir haben hier deinen Thread gekapert. Ich würde die Beiträge zu SMART und Co. mal auslagern, ok?