T520: Abrupte, zufällige Neustarts

fwolf

Member
Registriert
14 Okt. 2011
Beiträge
296
Gerade wieder erlebt: Das System startet abrupt neu. Grund: Unbekannt. Steht nix in den Logdateien, nada, null.
Suche nun schon seit Tagen herum, woran das liegen könnte[1]. System ist frisch umgestellt auf SSD, mit Linux Mint 17.3 XFCE.

Bei meinem vorherigen System, mit Linux Mint 17.2, und Kernel 3.13, hatte ich das Problem nicht.

Das System sitzt und läuft quasi dauerhaft im Dock, mit gestecktem Akku, der aber von Anfang an schon relativ durch war.

Aktuelles System:

OS: Linux Mint 17.3 XFCE, mit TLP (Basisconfig)
Kerneldata: Linux coolrunnings 3.19.0-32-generic #37~14.04.1-Ubuntu SMP Thu Oct 22 09:41:40 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux
4.2.0-36-generic #42~14.04.1-Ubuntu SMP Fri May 13 17:27:22 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux (Update von vor ca. 2 Wochen auf / mit LTS Enablement Stack)
SSD: Crucial MX 200, 256 GB (Alignment ok)
tlp-stat Dump
Nachtrag: Inzwischen ohne Akku im Dock

Altes System: Linux Mint 17.2 KDE, ohne TLP, Kernel 3.13, normale 320 GB WD-Platte (WD Scorpio Black; laut Aufkleber noch Original-Lenovo)


Meine Vermutungen bis dato:
- TLP-Problem (beim W520 tritt da offenbar was auf)
- Vt-x/Vt-d (ist nun deaktiviert; ebenfalls ein Fix für die W520er bzw. in einem entspr. Bug-Thread gefunden; scheint die Freezes erledigt zu haben, aber Reboots sind immer noch da)
- Lüfter-Problem (man liest immer wieder so Andeutungen raus)
- Energieversorgungsproblem (Akku vs. AC)


Fragen:


a) wenn es ein Lüfter-/Ruhezustands-/Energiesparmodus-Problem wäre, woran kann ich das erkennen? z.B. Auf welche Logeinträge muss ich achten?
b) sonstige Ideen? Immer her damit ;)

Danke im Voraus,
cu, w0lf.

[1] Richtig, ich habe bereits massig hier im Forum, bei Lenovo, im UbuntuUsers.de- als auch normalen Ubuntu-Forum herumgewühlt. Wenig fündig geworden.
 
Zuletzt bearbeitet:
TLP-Problem (beim W520 tritt da offenbar was auf)
Genau betrachtet sind es nahezu immer Bugs in den Stromsparfunktionen der Kerneltreiber, die dadurch ausgelöst werden, dass TLP die Unverfrorenheit besitzt, diese zu aktivieren. Apropos Kernel:
Linux coolrunnings 3.19.0-32-generic #37~14.04.1-Ubuntu SMP Thu Oct 22 09:41:40 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux
Das ist mal wieder typisch Mint: ein uralter Kernel. Der Benutzer darf selbst auf den Trichter kommen die automatischen Updates zu aktivieren. Mal schauen ob die Minties das irgendwann nochmal auf die Kette bekommen ... wozu Security-Updates, pah ... :D.

Bitte in der Mint-Updateverwaltung alles aktivieren – insbesondere Kat. 4+5 – und einspielen. Oder gleich auf die Ubuntu-Systematik umstellen --> http://thinkwiki.de/Ubuntu_LTS_Enablement_Stack

Dann mit aktuellem Kernel neu testen.

Lüfter-Problem (man liest immer wieder so Andeutungen raus)
Lüfterprobleme hört man im allgemeinen. Mag sein, dass besonders sensible User sie auch lesen können (aus dem Kaffeesatz?). Belesene User schauen hingegen auch mal die Temperaturen an.
Energieversorgungsproblem (Akku vs. AC)
Schon mal den Akku weggelassen?
 
Zuletzt bearbeitet:
Genau betrachtet sind es nahezu immer Bugs in den Stromsparfunktionen der Kerneltreiber, die dadurch ausgelöst werden, dass TLP die Unverfrorenheit besitzt, diese zu aktivieren. Apropos Kernel:
Das ist mal wieder typisch Mint: ein uralter Kernel. Der Benutzer darf selbst auf den Trichter kommen die automatischen Updates zu aktivieren. Mal schauen ob die Minties das irgendwann nochmal auf die Kette bekommen ... wozu Security-Updates, pah ... :D.

Du wirst lachen, aber: Mein Debian 8 hat sogar noch nen älteren Kernel, nämlich 3.16 :facepalm:

Bitte in der Mint-Updateverwaltung alles aktivieren – insbesondere Kat. 4+5 – und einspielen.
sorry, aber ich verwende prinzipiell nur Synaptic oder die Kommandozeile ;)
Und ja, die Priorities habe ich dezent wieder auf die von "Basis-Ubuntu" zurückgesetzt.


Oder gleich auf die Ubuntu-Systematik umstellen --> http://thinkwiki.de/Ubuntu_LTS_Enablement_Stack

Damit besser nicht. Führte zu unauflösbaren Paketkonflikten. Die EINDEUTIG bessere Wahl: https://wiki.ubuntuusers.de/LTS_Enablement_Stacks/
Reboot gleich. Dann sehen wir weiter :)

Lüfterprobleme hört man im allgemeinen. Mag sein, dass besonders sensible User sie auch lesen können (aus dem Kaffeesatz?). Belesene User schauen hingegen auch mal die Temperaturen an.

Was in diesem Moment kaum geht. Und mit "Lüfterproblemen" sind natürlich Anlauf/Ruhezeiten gemeint. Die Andeutung war sowas wie: Lüfter springt an, Rechner bootet abrupt neu. Also irgendein Spannungs- oder Sensorenproblem.

Schon mal den Akku weggelassen?

Das wäre noch .. auf Langzeit .. zu testen. Ein Kurzzeit-Test erbrachte keine Unterschiede.

Und wie gesagt: Die Probleme hatte ich mit dem alten System / Kernel nicht. Windoof lief auch ohne, aber die tricksen ja sowieso außerordentlich abartig um etwaige HW- und Bios-Probleme herum, das is natürlich nich vergleichbar.


- - - Beitrag zusammengeführt - - -

Neuerungen nach dem Neustart mit Kernel 4.2 + neuem X.org (dmesg-Auszug):

Code:
[    0.101250] ACPI: Added _OSI(Module Device)
[    0.101255] ACPI: Added _OSI(Processor Device)
[    0.101258] ACPI: Added _OSI(3.0 _SCP Extensions)
[    0.101261] ACPI: Added _OSI(Processor Aggregator Device)
[    0.102547] ACPI : EC: EC description table is found, configuring boot EC
[    0.102560] ACPI : EC: EC started
[B][    0.106065] [Firmware Bug]: ACPI: BIOS _OSI(Linux) query ignored[/B]
[    0.109034] ACPI: Dynamic OEM Table Load:
[    0.109047] ACPI: SSDT 0xFFFF8802145AE000 0008C0 (v01 PmRef  Cpu0Cst  00003001 INTL 20061109)
[    0.109545] ACPI: Dynamic OEM Table Load:
[    0.109554] ACPI: SSDT 0xFFFF8802145B2400 000303 (v01 PmRef  ApIst    00003000 INTL 20061109)
[    0.109988] ACPI: Dynamic OEM Table Load:
[    0.109996] ACPI: SSDT 0xFFFF880214573800 000119 (v01 PmRef  ApCst    00003000 INTL 20061109)
[    0.110773] ACPI: Interpreter enabled
[    0.110781] ACPI Exception: AE_NOT_FOUND, While evaluating Sleep State [\_S1_] (20150619/hwxface-580)
[    0.110789] ACPI Exception: AE_NOT_FOUND, While evaluating Sleep State [\_S2_] (20150619/hwxface-580)
[    0.110805] ACPI: (supports S0 S3 S4 S5)
[    0.110808] ACPI: Using IOAPIC for interrupt routing
[    0.110830] PCI: Using host bridge windows from ACPI; if necessary, use "pci=nocrs" and report a bug

die Meldung mit dem Firmware-Bug gab es vorher nicht.
Das Thema mit pci=nocrs habe ich noch im Hinterkopf, in Verbindung mit den Freezes.

scheint aber nicht von Relevanz zu sein => https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1275985

Vollständiges dmesg: https://gist.github.com/ginsterbusch/f7be5cf283ac0c6525d6608b6b41f440

Nachtrag #2: Ich teste jetz mal die nächsten Tage ohne Akku. Das System ist übrigens 24/7 an (ja, gut, manchmal mach ich auch den Deckel zu = Suspend Mode).
Es ist auch mein derzeitiges Hauptsystem, also nix so für Zwischendurch.
Hoffen mir mal, dass es am Akku liegt.

cu, w0lf.

ps: das automatisierte Beitragszusammenführen nervt grad etwas .. das sollten eigentlich ZWEI posts sein o_O

- - - Beitrag zusammengeführt - - -

(Mo 23. Mai 13:46:06 CEST 2016)
Wir beobachten weiter. Seit heute morgen ohne Akku.
Aktuell noch keine Neustarts - nach einer Ruhephase von ca. 6 Stunden (Arbeit hin oder her, ich brauche auch mal meinen Schönheitsschlaf :D).

cu, w0lf.
 
Zuletzt bearbeitet:
Hast Du den neuen Kernel und Grafikstack zuerst mit Akku getestet – und trat das Problem wiedert auf? Ich würde es vermeiden, bei der Fehlersuche mehrere Dinge gleichzeitig zu ändern.

Mein Debian 8 hat sogar noch nen älteren Kernel, nämlich 3.16
Es ging mir nicht um die Frage 3.19 vs. 4.2 oder 3.16 oder was-auch-immer. Ein 3.16er mit aktuellem Patch-Stand ist nicht veraltet im Sinne von Security bzw. Fehlerbehebungen. Der 3.19.0-32 hingegen ist vom 22.10.2015, aktuell ist 3.19.0-60.

ps. in der dmesg steht viel wenn der Boot lang ist. Absturzursachen findest Du dort aber eigentlich nie.
 
Zuletzt bearbeitet:
.. das is merkwürdig. ich hatte da doch ne antwort geschrieben? :huh: *kopfkratz*

jedenfalls: dmesg nur im Bezug auf vorher. Dachte, ich hätte da was gefunden, war aber nix (is ein bekannter Fehler / Warnung).
Die anderen Logdateien geben leider keinen Aufschluß (weder Kernel Panic, noch abrupte Temperaturänderungen, nocb sonst etwas, das nach einem Fehler aussieht) :(


cu, w0lf.
 
Inzwischen: Heute nacht gg. 5 uhr wieder ein abrupter "Neustart". Nur in diesem Fall: Kein Neustart, sondern ein Shutdown. Weil ja kein Akku drin.
Fühlt sich für mich nach nem Defekt an der Dockingstation oder Netzteil an.

Letzteres kann ich ersetzen - hab hier sicher 4 - 5 Stück (allesamt 90W) herumliegen. Ersteres vorerst nicht ..

cu, w0lf.
 
Ein Test ohne Dock könnte helfen, die Sache einzugrenzen.
 
Ein Test ohne Dock könnte helfen, die Sache einzugrenzen.

muss mal gucken, wie ich das gelöst bekomme. Das Gerät ist ja mein aktueller Haupt(arbeits!)rechner, und läuft primär im stationären Betrieb.
Wenn es das Dock wäre - was könnte da kaputt bzw. das Problem sein?

cu, w0lf.
 
Es kann alles sein - die Dock (Elektronik), ein angeschlossenes Gerät oder auch der Rechner selbst.
 
Es kann alles sein - die Dock (Elektronik), ein angeschlossenes Gerät oder auch der Rechner selbst.

hm .. also dran hängen ja nur (über die DS) mein Monitor, Tastatur und Maus. Sowie Lautsprecher.

Monitor: Iiyama XB2483HSU (AMVA+), 1920x1080
Tasta: Cherry G80-3000
Maus: Sharkoon Shark Force
Lautsprecher: irgenwas Marke Trust mit sep. Ein/Ausschalter

Nachtrag:

Das Problem gab es (wie glaube ich schon erwähnt) bereits früher mal, hatte ich aber mit dem komischen "nur mit 'Original-Firmware'"-Gedöhns der Festplatte verbunden, denn die Neustarts traten fast immer zeitgleich mit dem Festplattenkopf-Schaben auf, wenn der Stromspar-Treiber vergeblich versuchte, selbige in Park/Leerlaufposition zu schieben (WD Scorpio Black / WD3200BEKT / FRU 45N7325 / ASM 45N7324).
Nach dem Wechsel zur SSD ist das ja fast vollständig verschwunden, aber eben nicht ganz.

Daher: Könnte es sich um ein generelles Problem mit irgendeiner Leerlauf/Runterschalt-Funktion handeln?

cu, w0lf.
 
Zuletzt bearbeitet:
Aktueller Stand (02.07.2016): Seitdem ich den "neuen" Akku drin hab, treten die random reboots wieder häufiger auf.
Allerdings hatte ich letztens einen, da war auch bei der Fritzbox kurz der Saft weg; daher werd ich als nächstes mal das Netzteil wechseln, vtl. hat das ja irgendwo nen kurzen.
Zum weiteren Test besorge ich mir diesen Monat auch noch ne zwote DS .. und da ich eh auf Quadcore aufrüsten will, auch noch ein Zweit/Schlachtsystem mit nVidia (wg. dem besseren Lüfter und Case mit zwotem Lüfterauslass/Gitter/whatever its called).

cu, w0lf.
 
Neuester Stand: Nach einem kurzen Intermezzo mit mehrfachem "rein-raus" aus dem Dock, scheint jetz alles wieder normal zu laufen. Werde mich aber demnächst nach einer zwoten DS umschauen, denn das TP sitzt etwas "locker" bzw. trotz Verriegelung kann man das Gerät teilweise trotzdem abnehmen. Tippe daher momentan auf nen Wackler / Defekt in der DS.

cu, w0lf.
 
Zuletzt bearbeitet:
Einen festeren Halt in der Dock wirst Du bekommen. Die Wackler habe ich bei einigen T420/T420s.
 
ich hab mir jetz mal die DS ohne das Plus drin bestellt. MIT Schlüsseln. Werde damit mal testen - gehe pauschal davon aus, dass das mein Problem löst :)
Hätte auch den Vorteil, dass ich nicht jedes Mal ewig und drei Tage rumfummeln muss, wenn ich meinen Lautsprecheranschluss vom T400 ans T520 umstöpsel. Die Position für die Audio-Anschlüsse rechts nebendran mag für die T4xx-Reihe ja ne nette Idee gewesen sein, für T/W5xx isses aber total madig.

cu, w0lf.
 
So, DS is da, und wird in den nächsten Tagen getauscht. Ggf. mach ich auch noch nen Gegentest mit dem T410 .. je nachdem, wieviel Zeit ich grad hab.

cu, w0lf.
 
Abrupter Neustart ist trotz des neuen Docks wieder aufgetreten. Thinkpad sitzt solide und nicht wackelig. Werde es als nächstes mit bisserl Netzteil-Jonglage probieren.

cu, w0lf.
 
Beobachtung: CPU geht immer kurz vor Neustart auf Vollgas.
Und noch eine: Meine Glühbirnen brennen hier öfters aus, als eigentlich sein dürfte. Deutet auf ein eher instabileres Stromnetz hin.

Habe jetzt das Netzteil komplett getauscht, mal schaun, ob das was bringt. In Anbetracht der zwoten Beobachtung werde ich mir wohl auch noch was in Sachen USV organisieren.

cu, w0lf.
 
Bei meinem vorherigen System, mit Linux Mint 17.2, und Kernel 3.13, hatte ich das Problem nicht.

Dann würde ich vermutlich zu dieser (ebenfalls bis April 2019 unterstützten) Version zurückkehren (die alte Festplatte hast Du hoffentlich noch)...


Beobachtung: CPU geht immer kurz vor Neustart auf Vollgas.

Das spräche ebenfalls für ein Softwareproblem.
 
Dann würde ich vermutlich zu dieser (ebenfalls bis April 2019 unterstützten) Version zurückkehren (die alte Festplatte hast Du hoffentlich noch)...

Technisch unmöglich, denn ich hatte Linux Mint nie auf einer Platte :D
Werde aber mal bei nächster Gelegenheit den Kernel umschalten und gucken, ob das was hilft.

Das spräche ebenfalls für ein Softwareproblem.

Nachdem ich in Bälde eh auf ein T520p "wechsle", und da eine größere SSD mit entweder Ubuntu 16.04 oder Siduction rein kommt, erledigt sich das Problem hoffentlich bald von selbst.

cu, w0lf.
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben