Hallo,
nachdem bei meinem T410 jetzt Endlich das Problem mit dem Bluetooth http://thinkpad-forum.de/threads/129784-Bluetooth-funktioniert-nicht-mehr gelöst wurde, habe ich das Problem, dass der Rechner unter Volllast einfach aus geht. Ich betreibe den Rechner sehr häufig unter Volllast (auswendige Generierung von Software) und hatte bisher niemals Probleme. Ich arbeite unter Linux Mint und konnte folgende Einträge im syslog finden:
Dies lässt den Schluss zu, dass die CPU einfach zu heiß wurde. Allerdings hat der Techniker beim heutigen Wechseln des Kabels zwischen Motherboard und Bluetooth-Karte extra noch Wäremeleitpaste aufgetragen, da ich heute morgen schon einmal dieses Problem hatte. Seit heute Nachmittag ist es immer wieder reproduzierbar und liefert unter Linux entsprechende syslog-Einträge.
Unsere Generierungs-Software läuft auch unter Windows, sodass ich dies eben auch getestet habe. Dort ging das Notebook auch an der gleichen Stelle einfach aus. Es wurde noch sehr kurz eine Fehlermeldung angezeigt, die eher auf einen Festplattenfehler schließen lässt. Habe dann mal das Lenovo-Diagnosetool laufen lassen und es wurden tatsächlich zwei Fehler bei der Platte angezeigt: Der gezielte Lesetest wurde nach 5 Sektorfehlern abgebrochen und kurze SMART Selbsttest gab es folgende Fehler: "Das Gerät hat den folgenden Status gemeldet: Beim Abschluss des vorangegangenen Selbsttests ist ein Fehler am Leseelement des Tests aufgetreten." und "Der erste fehlgeschlagene LBA-Wert lautet 437034447 und der Fehler trat auf, nachdem das Gerät 7068 Power-On-Stunden betrieben wurde."
Jetzt frage ich mich nur, ob es sich auch unter Linux in Wirklichkeit auch Probleme mit der Festplatte gab oder ob dort die CPU zu heiß wurde. Kann das jemand von euch einschätzen? Generell kann ich mir an der Stelle des Generierungsprozesses schon einen Festplattenfehler vorstellen, da kontinuierlich Dateien in einen Cache geschrieben werden und die Festplatte somit stark beansprucht wird.
Wäre schön, wenn jemand von eine Einschätzung abgeben könnte. Ich werde jetzt noch mal einen ausführlicheren SMART-Test unter Linux starten.
nachdem bei meinem T410 jetzt Endlich das Problem mit dem Bluetooth http://thinkpad-forum.de/threads/129784-Bluetooth-funktioniert-nicht-mehr gelöst wurde, habe ich das Problem, dass der Rechner unter Volllast einfach aus geht. Ich betreibe den Rechner sehr häufig unter Volllast (auswendige Generierung von Software) und hatte bisher niemals Probleme. Ich arbeite unter Linux Mint und konnte folgende Einträge im syslog finden:
Code:
Jan 16 15:55:44 JanNB kernel: [ 115.955996] wlan0: deauthenticating from 00:24:c4:d2:fd:e1 by local choice (reason=3)
Jan 16 15:55:44 JanNB kernel: [ 116.111373] wlan0: authenticate with 00:24:c4:d2:d7:61 (try 1)
Jan 16 15:55:44 JanNB kernel: [ 116.114880] wlan0: authenticated
Jan 16 15:55:44 JanNB wpa_supplicant[1087]: CTRL-EVENT-DISCONNECTED bssid=00:24:c4:d2:d7:61 reason=0
Jan 16 15:55:44 JanNB NetworkManager[913]: <info> (wlan0): supplicant connection state: associating -> disconnected
Jan 16 15:55:44 JanNB kernel: [ 116.209881] wlan0: associate with 00:24:c4:d2:d7:61 (try 1)
Jan 16 15:55:44 JanNB wpa_supplicant[1087]: Associated with 00:24:c4:d2:d7:61
Jan 16 15:55:44 JanNB wpa_supplicant[1087]: CTRL-EVENT-CONNECTED - Connection to 00:24:c4:d2:d7:61 completed (reauth) [id=0 id_str=]
Jan 16 15:55:44 JanNB NetworkManager[913]: <info> (wlan0): supplicant connection state: disconnected -> associated
Jan 16 15:55:44 JanNB NetworkManager[913]: <info> (wlan0): supplicant connection state: associated -> completed
Jan 16 15:55:44 JanNB kernel: [ 116.214148] wlan0: RX AssocResp from 00:24:c4:d2:d7:61 (capab=0x421 status=0 aid=2)
Jan 16 15:55:44 JanNB kernel: [ 116.214152] wlan0: associated
Jan 16 15:55:50 JanNB NetworkManager[913]: <info> (wlan0): roamed from BSSID 00:24:C4:D2:FD:E1 (webauth) to 00:24:C4:D2:D7:61 (webauth)
Jan 16 15:59:09 JanNB dhclient: DHCPREQUEST of 131.234.55.91 on wlan0 to 172.24.6.65 port 67
Jan 16 15:59:36 JanNB dhclient: last message repeated 4 times
Jan 16 15:59:36 JanNB kernel: [ 347.564108] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 9199, limit 9000
Jan 16 15:59:42 JanNB dhclient: DHCPREQUEST of 131.234.55.91 on wlan0 to 172.24.6.65 port 67
Jan 16 16:00:14 JanNB dhclient: last message repeated 3 times
Jan 16 16:00:16 JanNB kernel: [ 387.464089] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 9764, limit 9000
Jan 16 16:00:26 JanNB kernel: [ 397.439083] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 9606, limit 9000
Jan 16 16:00:28 JanNB kernel: [ 398.865346] CPU2: Core temperature above threshold, cpu clock throttled (total events = 1)
Jan 16 16:00:28 JanNB kernel: [ 398.865353] CPU3: Core temperature above threshold, cpu clock throttled (total events = 1)
Jan 16 16:00:28 JanNB kernel: [ 398.868446] CPU2: Core temperature/speed normal
Jan 16 16:00:28 JanNB kernel: [ 398.868449] CPU3: Core temperature/speed normal
Jan 16 16:00:31 JanNB dhclient: DHCPREQUEST of 131.234.55.91 on wlan0 to 172.24.6.65 port 67
Jan 16 16:00:31 JanNB kernel: [ 402.426593] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 10299, limit 9000
Jan 16 16:00:32 JanNB kernel: [ 403.166518] Critical temperature reached (100 C), shutting down.
Jan 16 16:00:32 JanNB kernel: [ 403.171498] Critical temperature reached (100 C), shutting down.
Jan 16 16:00:32 JanNB kernel: Kernel logging (proc) stopped.
Jan 16 16:00:32 JanNB rsyslogd: [origin software="rsyslogd" swVersion="4.6.4" x-pid="898" x-info="http://www.rsyslog.com"] exiting on signal 15.
Jan 16 17:35:29 JanNB kernel: imklog 4.6.4, log source = /proc/kmsg started.
Dies lässt den Schluss zu, dass die CPU einfach zu heiß wurde. Allerdings hat der Techniker beim heutigen Wechseln des Kabels zwischen Motherboard und Bluetooth-Karte extra noch Wäremeleitpaste aufgetragen, da ich heute morgen schon einmal dieses Problem hatte. Seit heute Nachmittag ist es immer wieder reproduzierbar und liefert unter Linux entsprechende syslog-Einträge.
Unsere Generierungs-Software läuft auch unter Windows, sodass ich dies eben auch getestet habe. Dort ging das Notebook auch an der gleichen Stelle einfach aus. Es wurde noch sehr kurz eine Fehlermeldung angezeigt, die eher auf einen Festplattenfehler schließen lässt. Habe dann mal das Lenovo-Diagnosetool laufen lassen und es wurden tatsächlich zwei Fehler bei der Platte angezeigt: Der gezielte Lesetest wurde nach 5 Sektorfehlern abgebrochen und kurze SMART Selbsttest gab es folgende Fehler: "Das Gerät hat den folgenden Status gemeldet: Beim Abschluss des vorangegangenen Selbsttests ist ein Fehler am Leseelement des Tests aufgetreten." und "Der erste fehlgeschlagene LBA-Wert lautet 437034447 und der Fehler trat auf, nachdem das Gerät 7068 Power-On-Stunden betrieben wurde."
Jetzt frage ich mich nur, ob es sich auch unter Linux in Wirklichkeit auch Probleme mit der Festplatte gab oder ob dort die CPU zu heiß wurde. Kann das jemand von euch einschätzen? Generell kann ich mir an der Stelle des Generierungsprozesses schon einen Festplattenfehler vorstellen, da kontinuierlich Dateien in einen Cache geschrieben werden und die Festplatte somit stark beansprucht wird.
Wäre schön, wenn jemand von eine Einschätzung abgeben könnte. Ich werde jetzt noch mal einen ausführlicheren SMART-Test unter Linux starten.