E
enrico65
Guest
Themenstarter
Hallo allerseits,
habe hier ein Desaster ohnegleichen:
1. Episode: Letzte Woche hat plötzlich mein A22p (512 MB RAM) Probleme beim Booten - mal bleibt er gleich nach Auswahl einer Distri im Grub-Bootmanager hängen, mal im Anmeldebildschirm, mal läuft er eine Weile und stürzt dann blitzartig ab. Warmstart war dann nicht mehr möglich, beim nächsten Kaltstart passiert das wieder. Rescue-Start zeigt an, dass der nagelneue Brenner I/O-Pufferfehler hat. Also Brenner raus, jetzt kommt der Rechner hoch, stürzt dann aber nach ein paar Minuten wieder ab. Also Kernelmeldungen angesehen: RAM-Adressen defekt, Kernel panic. RAM raus, neues rein, Maschine läuft etwa eine Stunde, dann das gleiche wieder. Nach einigen Kaltstarts geht jetzt auch mit dem neuen RAM nichts mehr. Festplatte plattgemacht, Neuinstallation ausprobiert - geht nicht mehr. Dann Memtest-Lauf: Memtest zeigt Unmengen von Speicherfehlern an. Also habe ich zunächst neuen Speicher bestellt.
2. Episode: Heute fängt mein A21p (auch 512 MB) mit den gleichen Spielchen an. Auch dort geht mittlerweile nichts mehr, Speicherfehler ohne Ende, baugleicher Brenner ebenfalls angeblich defekt. Im A31p laufen beide Brenner problemlos. Dann baue ich heute probehalber aus dem A22p den defekten Speicher in den A21p, und siehe da, die Maschine läuft. Ich lasse memtest komplett durchlaufen und schalte die Maschine ab, nachdem memtest keinerlei Speicherfehler mehr gemeldet hat. Nach etwa einer Stunde schalte ich wieder ein, und der Rechner steht komplett. IBM-Logo erscheint noch, Grub erscheint, sofort nach Auswahl der Distri Speicherfehler und Kernel panic. Das bei CentOS 4.4, Ubuntu 6.06, Xubuntu 6.06, SAM-Linux 3-2006. Auf dem A22p waren es Edubuntu 6.06.1 und Xandros Desktop 3.1.
3. Episode: Habe seit einer Woche eine Maschine von einem Kunden, die unter Xandros 3.1 läuft. Blieb neuerdings immer öfter mit der Meldung "Kernel wird initialisiert..." hängen. Memtest zeigt Unmengen von Speicherfehlern. Also am Samstag zwei neue Riegel hinein - Gerät läuft wieder. Gestern nachmittag schalte ich ihn wieder ein - Speicherfehler, Maschine bleibt gleich nach dem Start noch im LILO mit "Kernel wird initialisiert..." hängen. Heute mittag habe ich den neuen Speicher wieder raus und den alten, laut memtest defekten, rein zusammen mit einer neuen Festplatte. Danach läuft die Installation von Xandros problemlos durch und der Rechner läuft anständig. Allerdings habe ich in der lilo.conf ein paar kleine Änderungen vorgenommen, da mir die Probleme eigentlich nur auf den ACPI-Dämon zurückzuführen sind. Habe also acpi=off und noresume und noresume2 eingetragen. Scheint jetzt zunächst zu gehen.
Nun meine Frage an Mitleidende:
1. Werden beim Ausschalten der Maschinen irgendwelche Daten im RAM vorgehalten, die dann für die Speicherfehler verantwortlich sind (so eine Art Hibernate)? Es scheint ja so zu sein, dass die RAM-Bausteine nach einigen Tagen Lagerung an der frischen Luft wieder funktionsfähig sind. Wäremeentwicklung schliesse ich aus, sind ja sonst tadellos gelaufen, auch im Sommer bei 35°C im Schatten. Überspannung schliesse ich mittlerweile auch aus, dann wären die Riegel ja dauerhaft defekt und würden sich nicht "regenerieren". Statische Entladung schliesse ich bei jetzt drei Maschinen auch aus, zumal die auch in verschiedener Umgebung stehen und so etwas noch nie passiert ist.
2. Ist jemandem bekannt, ob hier vielleicht bei den A-Serie-Geräten die BIOS-Version 38 dafür verantwortlich ist? IBM hat laut Changelog nur neue Power-Management-Mechanismen dort integriert, das scheint sich nicht mit manchen Distris zu vertragen?
3. Zwar wird lm-sensors laut dmesg ausgeschaltet, aber funktioniert das auch wirklich richtig? Ich habe z.B. bei CentOS festgestellt, dass trotz acpi=off der ACPI-Dämon geladen wird und aktiv ist.
Ich denke, bevor ich jetzt das BIOS downgrade (sofern das überhaupt klappt bei den angeschlagenen Maschinen) und womöglich Speicherriegel für einige hundert Euro zumindest vorübergehend ins Nirwana schicke, warte ich erst mal, ob hier jemand Ähnliches erlebt hat. Laut IBM-Support wird der 300PL nicht mehr supported, und was die Speicherfehler anbetrifft, hat man mir zu Neukauf geraten. X(
Also schon mal vielen Dank für Eure Hinweise!
habe hier ein Desaster ohnegleichen:
1. Episode: Letzte Woche hat plötzlich mein A22p (512 MB RAM) Probleme beim Booten - mal bleibt er gleich nach Auswahl einer Distri im Grub-Bootmanager hängen, mal im Anmeldebildschirm, mal läuft er eine Weile und stürzt dann blitzartig ab. Warmstart war dann nicht mehr möglich, beim nächsten Kaltstart passiert das wieder. Rescue-Start zeigt an, dass der nagelneue Brenner I/O-Pufferfehler hat. Also Brenner raus, jetzt kommt der Rechner hoch, stürzt dann aber nach ein paar Minuten wieder ab. Also Kernelmeldungen angesehen: RAM-Adressen defekt, Kernel panic. RAM raus, neues rein, Maschine läuft etwa eine Stunde, dann das gleiche wieder. Nach einigen Kaltstarts geht jetzt auch mit dem neuen RAM nichts mehr. Festplatte plattgemacht, Neuinstallation ausprobiert - geht nicht mehr. Dann Memtest-Lauf: Memtest zeigt Unmengen von Speicherfehlern an. Also habe ich zunächst neuen Speicher bestellt.
2. Episode: Heute fängt mein A21p (auch 512 MB) mit den gleichen Spielchen an. Auch dort geht mittlerweile nichts mehr, Speicherfehler ohne Ende, baugleicher Brenner ebenfalls angeblich defekt. Im A31p laufen beide Brenner problemlos. Dann baue ich heute probehalber aus dem A22p den defekten Speicher in den A21p, und siehe da, die Maschine läuft. Ich lasse memtest komplett durchlaufen und schalte die Maschine ab, nachdem memtest keinerlei Speicherfehler mehr gemeldet hat. Nach etwa einer Stunde schalte ich wieder ein, und der Rechner steht komplett. IBM-Logo erscheint noch, Grub erscheint, sofort nach Auswahl der Distri Speicherfehler und Kernel panic. Das bei CentOS 4.4, Ubuntu 6.06, Xubuntu 6.06, SAM-Linux 3-2006. Auf dem A22p waren es Edubuntu 6.06.1 und Xandros Desktop 3.1.
3. Episode: Habe seit einer Woche eine Maschine von einem Kunden, die unter Xandros 3.1 läuft. Blieb neuerdings immer öfter mit der Meldung "Kernel wird initialisiert..." hängen. Memtest zeigt Unmengen von Speicherfehlern. Also am Samstag zwei neue Riegel hinein - Gerät läuft wieder. Gestern nachmittag schalte ich ihn wieder ein - Speicherfehler, Maschine bleibt gleich nach dem Start noch im LILO mit "Kernel wird initialisiert..." hängen. Heute mittag habe ich den neuen Speicher wieder raus und den alten, laut memtest defekten, rein zusammen mit einer neuen Festplatte. Danach läuft die Installation von Xandros problemlos durch und der Rechner läuft anständig. Allerdings habe ich in der lilo.conf ein paar kleine Änderungen vorgenommen, da mir die Probleme eigentlich nur auf den ACPI-Dämon zurückzuführen sind. Habe also acpi=off und noresume und noresume2 eingetragen. Scheint jetzt zunächst zu gehen.
Nun meine Frage an Mitleidende:
1. Werden beim Ausschalten der Maschinen irgendwelche Daten im RAM vorgehalten, die dann für die Speicherfehler verantwortlich sind (so eine Art Hibernate)? Es scheint ja so zu sein, dass die RAM-Bausteine nach einigen Tagen Lagerung an der frischen Luft wieder funktionsfähig sind. Wäremeentwicklung schliesse ich aus, sind ja sonst tadellos gelaufen, auch im Sommer bei 35°C im Schatten. Überspannung schliesse ich mittlerweile auch aus, dann wären die Riegel ja dauerhaft defekt und würden sich nicht "regenerieren". Statische Entladung schliesse ich bei jetzt drei Maschinen auch aus, zumal die auch in verschiedener Umgebung stehen und so etwas noch nie passiert ist.
2. Ist jemandem bekannt, ob hier vielleicht bei den A-Serie-Geräten die BIOS-Version 38 dafür verantwortlich ist? IBM hat laut Changelog nur neue Power-Management-Mechanismen dort integriert, das scheint sich nicht mit manchen Distris zu vertragen?
3. Zwar wird lm-sensors laut dmesg ausgeschaltet, aber funktioniert das auch wirklich richtig? Ich habe z.B. bei CentOS festgestellt, dass trotz acpi=off der ACPI-Dämon geladen wird und aktiv ist.
Ich denke, bevor ich jetzt das BIOS downgrade (sofern das überhaupt klappt bei den angeschlagenen Maschinen) und womöglich Speicherriegel für einige hundert Euro zumindest vorübergehend ins Nirwana schicke, warte ich erst mal, ob hier jemand Ähnliches erlebt hat. Laut IBM-Support wird der 300PL nicht mehr supported, und was die Speicherfehler anbetrifft, hat man mir zu Neukauf geraten. X(
Also schon mal vielen Dank für Eure Hinweise!