T4xx (T400-450 ohne "T440s/T450s") Rechner geht bei hoher Last aus

misterjan

New member
Registriert
30 Mai 2007
Beiträge
201
Hallo,
nachdem bei meinem T410 jetzt Endlich das Problem mit dem Bluetooth http://thinkpad-forum.de/threads/129784-Bluetooth-funktioniert-nicht-mehr gelöst wurde, habe ich das Problem, dass der Rechner unter Volllast einfach aus geht. Ich betreibe den Rechner sehr häufig unter Volllast (auswendige Generierung von Software) und hatte bisher niemals Probleme. Ich arbeite unter Linux Mint und konnte folgende Einträge im syslog finden:

Code:
Jan 16 15:55:44 JanNB kernel: [  115.955996] wlan0: deauthenticating from 00:24:c4:d2:fd:e1 by local choice (reason=3)
Jan 16 15:55:44 JanNB kernel: [  116.111373] wlan0: authenticate with 00:24:c4:d2:d7:61 (try 1)
Jan 16 15:55:44 JanNB kernel: [  116.114880] wlan0: authenticated
Jan 16 15:55:44 JanNB wpa_supplicant[1087]: CTRL-EVENT-DISCONNECTED bssid=00:24:c4:d2:d7:61 reason=0
Jan 16 15:55:44 JanNB NetworkManager[913]: <info> (wlan0): supplicant connection state:  associating -> disconnected
Jan 16 15:55:44 JanNB kernel: [  116.209881] wlan0: associate with 00:24:c4:d2:d7:61 (try 1)
Jan 16 15:55:44 JanNB wpa_supplicant[1087]: Associated with 00:24:c4:d2:d7:61
Jan 16 15:55:44 JanNB wpa_supplicant[1087]: CTRL-EVENT-CONNECTED - Connection to 00:24:c4:d2:d7:61 completed (reauth) [id=0 id_str=]
Jan 16 15:55:44 JanNB NetworkManager[913]: <info> (wlan0): supplicant connection state:  disconnected -> associated
Jan 16 15:55:44 JanNB NetworkManager[913]: <info> (wlan0): supplicant connection state:  associated -> completed
Jan 16 15:55:44 JanNB kernel: [  116.214148] wlan0: RX AssocResp from 00:24:c4:d2:d7:61 (capab=0x421 status=0 aid=2)
Jan 16 15:55:44 JanNB kernel: [  116.214152] wlan0: associated
Jan 16 15:55:50 JanNB NetworkManager[913]: <info> (wlan0): roamed from BSSID 00:24:C4:D2:FD:E1 (webauth) to 00:24:C4:D2:D7:61 (webauth)
Jan 16 15:59:09 JanNB dhclient: DHCPREQUEST of 131.234.55.91 on wlan0 to 172.24.6.65 port 67
Jan 16 15:59:36 JanNB dhclient: last message repeated 4 times
Jan 16 15:59:36 JanNB kernel: [  347.564108] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 9199, limit 9000
Jan 16 15:59:42 JanNB dhclient: DHCPREQUEST of 131.234.55.91 on wlan0 to 172.24.6.65 port 67
Jan 16 16:00:14 JanNB dhclient: last message repeated 3 times
Jan 16 16:00:16 JanNB kernel: [  387.464089] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 9764, limit 9000
Jan 16 16:00:26 JanNB kernel: [  397.439083] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 9606, limit 9000
Jan 16 16:00:28 JanNB kernel: [  398.865346] CPU2: Core temperature above threshold, cpu clock throttled (total events = 1)
Jan 16 16:00:28 JanNB kernel: [  398.865353] CPU3: Core temperature above threshold, cpu clock throttled (total events = 1)
Jan 16 16:00:28 JanNB kernel: [  398.868446] CPU2: Core temperature/speed normal
Jan 16 16:00:28 JanNB kernel: [  398.868449] CPU3: Core temperature/speed normal
Jan 16 16:00:31 JanNB dhclient: DHCPREQUEST of 131.234.55.91 on wlan0 to 172.24.6.65 port 67
Jan 16 16:00:31 JanNB kernel: [  402.426593] intel ips 0000:00:1f.6: MCP limit exceeded: Avg temp 10299, limit 9000
Jan 16 16:00:32 JanNB kernel: [  403.166518] Critical temperature reached (100 C), shutting down.
Jan 16 16:00:32 JanNB kernel: [  403.171498] Critical temperature reached (100 C), shutting down.
Jan 16 16:00:32 JanNB kernel: Kernel logging (proc) stopped.
Jan 16 16:00:32 JanNB rsyslogd: [origin software="rsyslogd" swVersion="4.6.4" x-pid="898" x-info="http://www.rsyslog.com"] exiting on signal 15.
Jan 16 17:35:29 JanNB kernel: imklog 4.6.4, log source = /proc/kmsg started.

Dies lässt den Schluss zu, dass die CPU einfach zu heiß wurde. Allerdings hat der Techniker beim heutigen Wechseln des Kabels zwischen Motherboard und Bluetooth-Karte extra noch Wäremeleitpaste aufgetragen, da ich heute morgen schon einmal dieses Problem hatte. Seit heute Nachmittag ist es immer wieder reproduzierbar und liefert unter Linux entsprechende syslog-Einträge.

Unsere Generierungs-Software läuft auch unter Windows, sodass ich dies eben auch getestet habe. Dort ging das Notebook auch an der gleichen Stelle einfach aus. Es wurde noch sehr kurz eine Fehlermeldung angezeigt, die eher auf einen Festplattenfehler schließen lässt. Habe dann mal das Lenovo-Diagnosetool laufen lassen und es wurden tatsächlich zwei Fehler bei der Platte angezeigt: Der gezielte Lesetest wurde nach 5 Sektorfehlern abgebrochen und kurze SMART Selbsttest gab es folgende Fehler: "Das Gerät hat den folgenden Status gemeldet: Beim Abschluss des vorangegangenen Selbsttests ist ein Fehler am Leseelement des Tests aufgetreten." und "Der erste fehlgeschlagene LBA-Wert lautet 437034447 und der Fehler trat auf, nachdem das Gerät 7068 Power-On-Stunden betrieben wurde."

Jetzt frage ich mich nur, ob es sich auch unter Linux in Wirklichkeit auch Probleme mit der Festplatte gab oder ob dort die CPU zu heiß wurde. Kann das jemand von euch einschätzen? Generell kann ich mir an der Stelle des Generierungsprozesses schon einen Festplattenfehler vorstellen, da kontinuierlich Dateien in einen Cache geschrieben werden und die Festplatte somit stark beansprucht wird.

Wäre schön, wenn jemand von eine Einschätzung abgeben könnte. Ich werde jetzt noch mal einen ausführlicheren SMART-Test unter Linux starten.
 
Wie hast Du unter Windows getestet ? Selbe Platte mit Dual-Boot ?

Läuft die Software auf einem anderen Laptop ohne diesen zum Absturz zu bringen ?

Hast Du eine andere Platte zum Testen zur Hand ?
 
wenn die festplatte fehlerhaft ist, sollte schlimmstenfalls ein kernelpanic auftreten (wobei das auch schon ungewöhnlich ist), aber kein harter shutdown. das deutet eher auf überhitzung hin. wie sehen denn die temperaturen bei der generierung aus? ich tippe mal auf ca 100°c

edit:
wer lesen kann, ist klar im vorteil... :facepalm:

ist de kühler sauber, also frei von staub?
 
Hattest du vorm Austausch des Kabels das Problem ebenfalls?!

Irgendwie klingt das danach als würd der Kühler nicht mehr richtig sitzten.

Grüße
 
Hatte gerade schon ein etwas längliche Antwort fertig, da ist der Rechner schon wieder einfach aus gegangen, obwohl ich nur Firefox auf hatte und Daten auf eine externe Platte kopiert habe.

Also, jetzt alles noch mal: Habe rausgefunden, dass es auf jeden Fall nur Überhizungsproblem ist, einige defekte Senktoren sind nur ein "Nebenkriegsschauplatz".

Jetzt zu euren Fragen:
"Läuft die Software auf einem anderen Laptop ohne diesen zum Absturz zu bringen ?"
Ja, definitiv. Auf ein paar anderen sowohl unter Linux als auch Windows.

"ist de kühler sauber, also frei von staub?"
Wurde heute vom Techniker heute noch mal ausgebaut und ich habe ihn durchgepustet. Jeglicher Staub ist jetzt als weg.

"Hattest du vorm Austausch des Kabels das Problem ebenfalls?!"
Bis Anfang Januar bestand nur das Bluetooth-Problem, sonst war alles super! Rechner musste oft unter Volllast arbeiten; alles ohne Probleme. Jetzt ein kurzer Ablauf der Reperaturversuche:
1. Der Techniker tauscht am 9. Januar die Bluetooth-Karte. Das Problem besteht weiterhin.
2. Am 10. Januar tauscht der Techniker das Motherboard (Prozessor und Lüfter sind beim T410er nur auf das Motherboard gesteckt, werden also wiederverwendet). Auch danach ist das Problem nicht behoben.
3. Bis zum 16. Januar morgens arbeite ich ganz normal oft unter Volllast mit dem Rechner. Morgens geht der Rechner das erste mal während des Generierungsprozesses aus. Ich teile dies der Hotline auch mit und mache erneuten Druck, da jetzt zusätzlich zum Bluetooth dieses weitere Problem besteht.
3. Der Techniker kommt tatsächlich super schnell am Nachmittag des 16.1. und tauscht das Kabel zwischen BT-Karte und MB. Danach habe ich endlich wieder BT. Ursprünglicher Fehler also beseitigt. Wegen dem plötzlichen Ausschalten baut der Techniker auch noch mal den Lüfter aus und bringt Wärmeleitpaste auf (wobei ich dies persönlich nicht gesehen habe, da ich in der Zeit in einem anderen Raum der Lüfter mit einer Hochdruckluftdose durchgepustet habe. Aber ich kann und will dem Techniker dort nichts unterstellen). Danach dachte ich das Problem ist wirklich gegessen, aber das Gegenteil ist der Fall. Alle weiteren Tests (wie schon oben beschrieben) reproduzieren den Fehler.

Meint ihr wirklich, dass der Lüfter nicht richtig sitzt? Ist das wahrscheinlich, wenn der extra noch mal nach meiner Beschreibung des Problems ausgebaut wurde? Kann es andere logische Ursachen für dieses Problem geben?
 
wenn alles in ordnung wäre, würde der ĸühler die cpu bei laune halten, egal wie hoch die belastung ist (bei normalen umgebungstemperaturen zumindest). meiner eigenen erfahrung und der diverser anderer nach, wird die cpu runtergetaktet, wenn ihr zu heiß wird (häufiges drosseln bei x201 mit frühen bios-versionen). das sollte eigentlich reichen um das tp am laufen zu halten. kommt es dennoch zur notabschaltung, ist was im argen (kühler-defekt, schlechter wärmeübergang von cpu zum kühler, kühler verstaubt). sind bei dir vielleicht irgendwelchen optionen im bios oder so gesetzt, die energiesparmechnismus abschalten? gut möglich, dass dadurch die cpu nicht mehr runtertakten kann bei überhitzung.
 
Ich habe keine entsprechenden Optionen im BIOS gefunden. Ist aber auch unwahrscheinlich, dass dort was verstellt ist, da das BIOS seit dem Motherboard-Tausch auf den Default-Werten gesetzt ist.
Ich habe auf jeden Fall wieder die Lenovo-Hotline angerufen und der Techniker wird sich hoffentlich schnell bei mir melden, um dann den Lüfter zu tauschen.
 
Der Lüfter wurde gestern gewechselt und jetzt läuft der Rechner wieder normal und wird nicht mehr so heiß. Ich hoffe das bleibt auch so.
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben