X2xx Tablet SSD tot, Ursache finden

Photon

Member
Registriert
14 Aug. 2011
Beiträge
137
Hallo Community,

ich nutze einen Thinkpad X200T, habe ihn aufgerüstet auf 4GB RAM und die HDD mit einer SSD ersetzt. Auf dem Laptop läuft Manjaro Linux, es wird eine 4GB Swap-Partition genutzt (die auf der SSD liegt). Ich nutze den Suspend2Ram-Modus (beim Deckel Schließen) und es ist schon mal vorgekommen, dass der Laptop einen Monat ohne Herunterfahren durchgearbeitet hat. Der RAM und die Swap-Partition laufen dabei natürlich nach und nach voll.

Zunächst war eine Crucial m4 64 GB drin. Nach einigen Jahren Nutzung zeigte der Laptop folgende Symptome:

1. Sporadisches Einfrieren (komplettes Lockup, nur mit einem Hard-Reset zu beheben).
2. Sehr langsames Aufwachen aus dem Suspend2Ram-Modus mit viel Festplattenaktivität.

Nach einiger Zeit solcher Symptome fror der Thinkpad mal ein allerletztes mal ein und nach einem Hard Reset konnte er von der SSD nicht mehr booten, sie war tot und alle Daten futsch.

Das ist jetzt ein paar Jahre her. Ich habe eine neue SSD gekauft und eingebaut, eine WD Green 120GB. Doch nun geht es langsam los mit dem sporadischen Einfrieren und ich habe die Befürchtung, dass die neue SSD bald auch den Geist aufgibt.

Ursprünglich dachte ich, es liegt an der SSD selbst, denn die alte m4 hab ich gebraucht gekauft, dann selbst lange benutzt. Doch nun scheint dasselbe Schicksal die neue WD Green zu ereilen, die neu gekauft wurde und noch gar nicht so lange im Einsatz war. Liegt es also am Thinkpad selbst, der die SSDs ins Jenseits befördert? Oder an meinem Nutzungsverhalten (exzessives Nutzen der Swap-Partition auf der SSD durch Suspend2Ram-Modus)? Oder liegt die Ursache vielleicht doch ganz woanders?

Bleibt gesund!
Photon
 
Zuletzt bearbeitet:
Warum benutzt du Suspend2Ram das ist doch nicht mehr Notwendig einfach Standby reicht doch? Also ich hatte bis jetzt nur SD Karten die mir Defekt gegangen sind. Normale USB Sticks und SSD´s sind mir noch nicht defekt gegangen. Benutze eigentlich meine SSD sehr oft.
Hast du die Platte voll geschrieben das mag ne SSD nicht so weil dann die Sektoren nicht umgeschrieben werden können. Denke nicht das es an dein Laptop liegt.
 
Meinst du Suspend2Disk? Aber damit wäre es ja noch schlimmer, oder? Dann muss ja Swap UND Ram auf der Platte sein, bei Suspend2Ram zumindest nur der Swap.

Tatsächlich ist die SSD gerade bei ca. 98% Belegung. Könnte das der Grund für das Problem sein?
 
Ach, ich versuch es erst mal mit etwas Aufräumen, da ist ziemlich viel Müll drauf. Werde berichten, ob es was geholfen hat, danke für den Input!
 
Jepp 98% Auslastung tut der SSD nicht gut. Immer so ca. 20% Freilassen. Es sei denn du Schreibst nix mehr drauf ;-)
 
Hab jetzt eine Partition mit ca. 30GB gelöscht, die seit einem Jahr auf der Platte lag und nichts tat. Die Hauptpartition ist weiterhin bei 95%, 30GB sind also unpartitioniert. In diesem Zustand ist der Thinkpad vorhin wieder eingefroren... :( Ist zu erwarten, dass es besser wird, wenn ich die Hauptpartition ausdehne? Oder können wir die Überfüllung als Ursache ausschließen?

Hier die Smart-Werte:

Code:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.6.7-1-MANJARO] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     WD Blue and Green SSDs
Device Model:     WDC WDS120G1G0A-00SS50
Serial Number:    BLUBB
LU WWN Device Id: 5 001b44 8b69e8952
Firmware Version: Z3311000
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Tue Apr 28 14:54:38 2020 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is:   Unavailable
APM level is:     254 (maximum performance)
Rd look-ahead is: Enabled
Write cache is:   Enabled
DSN feature is:   Unavailable
ATA Security is:  Disabled, frozen [SEC2]

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:         (  120) seconds.
Offline data collection
capabilities:              (0x11) SMART execute Offline immediate.
                    No Auto Offline data collection support.
                    Suspend Offline collection upon new
                    command.
                    No Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    No Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (  10) minutes.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  5 Reallocated_Sector_Ct   -O--CK   100   100   000    -    0
  9 Power_On_Hours          -O--CK   000   100   000    -    3465
 12 Power_Cycle_Count       -O--CK   100   100   000    -    5566
165 Block_Erase_Count       -O--CK   100   100   000    -    6528512362755
166 Minimum_PE_Cycles_TLC   -O--CK   100   100   000    -    1
167 Max_Bad_Blocks_per_Die  -O--CK   100   100   000    -    0
168 Maximum_PE_Cycles_TLC   -O--CK   100   100   000    -    77
169 Total_Bad_Blocks        -O--CK   100   100   000    -    0
170 Grown_Bad_Blocks        -O--CK   100   100   000    -    0
171 Program_Fail_Count      -O--CK   100   100   000    -    0
172 Erase_Fail_Count        -O--CK   100   100   000    -    0
173 Average_PE_Cycles_TLC   -O--CK   100   100   000    -    29
174 Unexpected_Power_Loss   -O--CK   100   100   000    -    11
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
188 Command_Timeout         -O--CK   100   100   000    -    0
194 Temperature_Celsius     -O---K   070   043   000    -    30 (Min/Max 0/57)
199 UDMA_CRC_Error_Count    -O--CK   100   100   000    -    0
230 Media_Wearout_Indicator -O--CK   100   100   000    -    0x030101a80301
232 Available_Reservd_Space PO--CK   100   100   004    -    100
233 NAND_GB_Written_TLC     -O--CK   100   100   000    -    3494
234 NAND_GB_Written_SLC     -O--CK   100   100   000    -    10640
241 Host_Writes_GiB         ----CK   253   253   000    -    3216
242 Host_Reads_GiB          ----CK   253   253   000    -    4608
244 Temp_Throttle_Status    -O--CK   000   100   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning

General Purpose Log Directory Version 1
SMART           Log Directory Version 1 [multi-sector log support]
Address    Access  R/W   Size  Description
0x00       GPL,SL  R/O      1  Log Directory
0x01           SL  R/O      1  Summary SMART error log
0x02           SL  R/O      1  Comprehensive SMART error log
0x03       GPL     R/O      1  Ext. Comprehensive SMART error log
0x04       GPL,SL  R/O      8  Device Statistics log
0x06           SL  R/O      1  SMART self-test log
0x07       GPL     R/O      1  Extended self-test log
0x10       GPL     R/O      1  NCQ Command Error log
0x11       GPL     R/O      1  SATA Phy Event Counters log
0x30       GPL,SL  R/O      9  IDENTIFY DEVICE data log
0x80-0x9f  GPL,SL  R/W     16  Host vendor specific log
0xde       GPL     VS       8  Device vendor specific log

SMART Extended Comprehensive Error Log Version: 1 (1 sectors)
Device Error Count: 1
    CR     = Command Register
    FEATR  = Features Register
    COUNT  = Count (was: Sector Count) Register
    LBA_48 = Upper bytes of LBA High/Mid/Low Registers ]  ATA-8
    LH     = LBA High (was: Cylinder High) Register    ]   LBA
    LM     = LBA Mid (was: Cylinder Low) Register      ] Register
    LL     = LBA Low (was: Sector Number) Register     ]
    DV     = Device (was: Device/Head) Register
    DC     = Device Control Register
    ER     = Error register
    ST     = Status register
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 [0] log entry is empty
SMART Extended Self-test Log Version: 1 (1 sectors)
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

Selective Self-tests/Logging not supported

SCT Commands not supported

Device Statistics (GP Log 0x04)
Page  Offset Size        Value Flags Description
0x01  =====  =               =  ===  == General Statistics (rev 1) ==
0x01  0x008  4            5566  ---  Lifetime Power-On Resets
0x01  0x010  4            3465  ---  Power-on Hours
0x01  0x018  6      2450272333  ---  Logical Sectors Written
0x01  0x020  6       188816100  ---  Number of Write Commands
0x01  0x028  6      1075005454  ---  Logical Sectors Read
0x01  0x030  6       279252512  ---  Number of Read Commands
0x07  =====  =               =  ===  == Solid State Device Statistics (rev 1) ==
0x07  0x008  1               0  ---  Percentage Used Endurance Indicator
                                |||_ C monitored condition met
                                ||__ D supports DSN
                                |___ N normalized value

SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x0001  4            0  Command failed due to ICRC error
0x0002  4            0  R_ERR response for data FIS
0x0005  4            1  R_ERR response for non-data FIS
0x000a  4            2  Device-to-host register FISes sent due to a COMRESET

Sieht so weit gut aus, oder? Aber die alte m4 sah, wenn ich mich recht erinnere, auch unverdächtig aus, ist aber dann doch gestorben...
 
Zuletzt bearbeitet:
Beim Hersteller der Platte nach den angebotenen Tools nachsehen ist sicher nicht verkehrt....
nimm die Seriennummer raus, sonst eröffnet noch wer einen Vorabtausch ;-)
 
Danke, hab sie rausgenommen. :)

Welche Art von Tool meinst du denn? SMART-Werte haben wir ja jetzt, oder? Ich glaube, die Herstellertools können einem auch nicht mehr verraten und es gibt sie wahrscheinlich nicht für Linux...
 
Firmwareupdate geht nur unter Windows.. wenn du die Smartwerte interpretieren kannst!? Selftest kann jedenfalls nicht angeziegt werden.
Unabhängig wären ein Backup immer angebracht. Wofür du auch immer den Rechner hernimmst, an einer neuen Platte zu sparen ist eher mau.
 
Ah ja, ich bin doof, hab die Tests nicht laufen lassen. Mittlerweile aber schon, sowohl der Kurztest als auch der Langtest liefen ohne Fehler durch. Hier die aktualisierte Smart-Ausgabe:

Code:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.6.7-1-MANJARO] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     WD Blue and Green SSDs
Device Model:     WDC WDS120G1G0A-00SS50
Serial Number:    BLUBB
LU WWN Device Id: 5 001b44 8b69e8952
Firmware Version: Z3311000
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Tue Apr 28 16:42:52 2020 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is:   Unavailable
APM level is:     254 (maximum performance)
Rd look-ahead is: Enabled
Write cache is:   Enabled
DSN feature is:   Unavailable
ATA Security is:  Disabled, frozen [SEC2]

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  120) seconds.
Offline data collection
capabilities: 			 (0x11) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					No Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  10) minutes.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  5 Reallocated_Sector_Ct   -O--CK   100   100   000    -    0
  9 Power_On_Hours          -O--CK   000   100   000    -    3467
 12 Power_Cycle_Count       -O--CK   100   100   000    -    5566
165 Block_Erase_Count       -O--CK   100   100   000    -    6528512362755
166 Minimum_PE_Cycles_TLC   -O--CK   100   100   000    -    1
167 Max_Bad_Blocks_per_Die  -O--CK   100   100   000    -    0
168 Maximum_PE_Cycles_TLC   -O--CK   100   100   000    -    77
169 Total_Bad_Blocks        -O--CK   100   100   000    -    0
170 Grown_Bad_Blocks        -O--CK   100   100   000    -    0
171 Program_Fail_Count      -O--CK   100   100   000    -    0
172 Erase_Fail_Count        -O--CK   100   100   000    -    0
173 Average_PE_Cycles_TLC   -O--CK   100   100   000    -    29
174 Unexpected_Power_Loss   -O--CK   100   100   000    -    11
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
188 Command_Timeout         -O--CK   100   100   000    -    0
194 Temperature_Celsius     -O---K   066   043   000    -    34 (Min/Max 0/57)
199 UDMA_CRC_Error_Count    -O--CK   100   100   000    -    0
230 Media_Wearout_Indicator -O--CK   100   100   000    -    0x030101a80301
232 Available_Reservd_Space PO--CK   100   100   004    -    100
233 NAND_GB_Written_TLC     -O--CK   100   100   000    -    3494
234 NAND_GB_Written_SLC     -O--CK   100   100   000    -    10641
241 Host_Writes_GiB         ----CK   253   253   000    -    3216
242 Host_Reads_GiB          ----CK   253   253   000    -    4608
244 Temp_Throttle_Status    -O--CK   000   100   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning

General Purpose Log Directory Version 1
SMART           Log Directory Version 1 [multi-sector log support]
Address    Access  R/W   Size  Description
0x00       GPL,SL  R/O      1  Log Directory
0x01           SL  R/O      1  Summary SMART error log
0x02           SL  R/O      1  Comprehensive SMART error log
0x03       GPL     R/O      1  Ext. Comprehensive SMART error log
0x04       GPL,SL  R/O      8  Device Statistics log
0x06           SL  R/O      1  SMART self-test log
0x07       GPL     R/O      1  Extended self-test log
0x10       GPL     R/O      1  NCQ Command Error log
0x11       GPL     R/O      1  SATA Phy Event Counters log
0x30       GPL,SL  R/O      9  IDENTIFY DEVICE data log
0x80-0x9f  GPL,SL  R/W     16  Host vendor specific log
0xde       GPL     VS       8  Device vendor specific log

SMART Extended Comprehensive Error Log Version: 1 (1 sectors)
Device Error Count: 1
	CR     = Command Register
	FEATR  = Features Register
	COUNT  = Count (was: Sector Count) Register
	LBA_48 = Upper bytes of LBA High/Mid/Low Registers ]  ATA-8
	LH     = LBA High (was: Cylinder High) Register    ]   LBA
	LM     = LBA Mid (was: Cylinder Low) Register      ] Register
	LL     = LBA Low (was: Sector Number) Register     ]
	DV     = Device (was: Device/Head) Register
	DC     = Device Control Register
	ER     = Error register
	ST     = Status register
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 [0] log entry is empty
SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      3467         -
# 2  Short offline       Completed without error       00%      3467         -

Selective Self-tests/Logging not supported

SCT Commands not supported

Device Statistics (GP Log 0x04)
Page  Offset Size        Value Flags Description
0x01  =====  =               =  ===  == General Statistics (rev 1) ==
0x01  0x008  4            5566  ---  Lifetime Power-On Resets
0x01  0x010  4            3467  ---  Power-on Hours
0x01  0x018  6      2450534333  ---  Logical Sectors Written
0x01  0x020  6       188822224  ---  Number of Write Commands
0x01  0x028  6      1075085062  ---  Logical Sectors Read
0x01  0x030  6       279254075  ---  Number of Read Commands
0x07  =====  =               =  ===  == Solid State Device Statistics (rev 1) ==
0x07  0x008  1               0  ---  Percentage Used Endurance Indicator
                                |||_ C monitored condition met
                                ||__ D supports DSN
                                |___ N normalized value

SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x0001  4            0  Command failed due to ICRC error
0x0002  4            0  R_ERR response for data FIS
0x0005  4            1  R_ERR response for non-data FIS
0x000a  4            2  Device-to-host register FISes sent due to a COMRESET
 
Was du mal machen könntest: Leg' in den unpartitionierten 30GB eine neue Partition z.B. mit ext4 an. Mounte die Partition. Führe ein "sudo fstrim -v /mountpoint" aus. Unmounte die Partition und lösche sie wieder. Lasse den Rechner danach ruhig im Leerlauf eine Weile stehen.
Eventuell weiß der Controller der SSD noch gar nicht davon, dass er jetzt 30 GB freien Speicher für's Wear-Leveling und ggf. als Puffer für die Schreibvorgänge hat.
 
Klingt nach einer guten Idee, hab ich gerade gemacht und beobachte die Lage weiter. Vorhin ist mit das Ding schon wieder eingefroren, war aber noch vor dem Trimmen. Ich werde berichten, danke!

- - - Beitrag zusammengeführt - - -

Leider ist er mir heute wieder eingefroren. Mir ist aufgefallen, dass als es passierte, der RAM voll wurde, der Swap aber leer war. Ich hab nach dem Hard-Reset nochmal geprüft, der Swap ist korrekt gemountet. Andernfalls wäre ein Freeze, wenn der RAM voll ist, natürlich wenig überraschend.

Vielleicht ist das aber nur Zufall gewesen, dass RAM voll und Swap leer waren, ich beobachte die Sache weiter.

- - - Beitrag zusammengeführt - - -

Jetzt ist es schon wieder passiert. Diesmal war der Swap nicht leer, also war die Vermutung, es könnte auf den Swap nicht zugegriffen werden, falsch.

Im System-Journal (journalctl -b -1) findet sich übrigens nichts Verdächtiges.

Code:
Apr 30 13:44:55 Thinkpad-X200T kernel: audit: type=1130 audit(1588247095.298:178): pid=1 uid=0 auid=4294967295 ses=4294967295>
Apr 30 13:44:55 Thinkpad-X200T kernel: audit: type=1131 audit(1588247095.298:179): pid=1 uid=0 auid=4294967295 ses=4294967295>
Apr 30 13:44:55 Thinkpad-X200T systemd[1]: Started Generate mirrorlist.
Apr 30 13:52:26 Thinkpad-X200T wpa_supplicant[587]: wls1: WPA: Group rekeying completed with e8:37:7a:12:e3:03 [GTK=CCMP]
Apr 30 14:01:01 Thinkpad-X200T CROND[39527]: (root) CMD (run-parts /etc/cron.hourly)
Apr 30 14:07:05 Thinkpad-X200T systemd-logind[419]: Lid closed.
Apr 30 14:07:05 Thinkpad-X200T systemd-logind[419]: Suspending...
Apr 30 14:07:05 Thinkpad-X200T NetworkManager[406]: <info>  [1588248425.3689] manager: sleep: sleep requested (sleeping: no  >
Apr 30 14:07:05 Thinkpad-X200T NetworkManager[406]: <info>  [1588248425.3819] device (ttyACM1): state change: unavailable -> >
Apr 30 14:07:05 Thinkpad-X200T NetworkManager[406]: <info>  [1588248425.4213] manager: NetworkManager state is now ASLEEP
Apr 30 14:07:07 Thinkpad-X200T wpa_supplicant[587]: wls1: CTRL-EVENT-SIGNAL-CHANGE above=0 signal=-79 noise=9999 txrate=108000
Apr 30 14:07:10 Thinkpad-X200T systemd-logind[419]: Delay lock is active (UID 1000/photon, PID 1010/light-locker) but inhibit>
Apr 30 14:07:10 Thinkpad-X200T systemd[1]: Reached target Sleep.
Apr 30 14:07:10 Thinkpad-X200T systemd[1]: Starting Suspend...
Apr 30 14:07:12 Thinkpad-X200T systemd-sleep[46141]: Suspending system...
Apr 30 14:07:12 Thinkpad-X200T kernel: PM: suspend entry (deep)
Apr 30 14:07:12 Thinkpad-X200T kernel: Filesystems sync: 0.003 seconds
Apr 30 14:07:32 Thinkpad-X200T kernel: Freezing user space processes ... 
Apr 30 14:07:32 Thinkpad-X200T kernel: Freezing of tasks failed after 20.007 seconds (1 tasks refusing to freeze, wq_busy=0):
Apr 30 14:07:32 Thinkpad-X200T kernel: Xorg            D    0   559    434 0x00404084
Apr 30 14:07:32 Thinkpad-X200T kernel: Call Trace:
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? __schedule+0x2e8/0x7a0
Apr 30 14:07:32 Thinkpad-X200T kernel:  schedule+0x46/0xf0
Apr 30 14:07:32 Thinkpad-X200T kernel:  schedule_preempt_disabled+0x14/0x20
Apr 30 14:07:32 Thinkpad-X200T kernel:  __mutex_lock.isra.0+0x1ae/0x550
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? _raw_spin_unlock_irqrestore+0x20/0x40
Apr 30 14:07:32 Thinkpad-X200T kernel:  i915_vma_pin+0x3b7/0x6b0 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? next_heartbeat+0x53/0x70 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  eb_lookup_vmas+0x209/0xba0 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? preempt_count_add+0x68/0xa0
Apr 30 14:07:32 Thinkpad-X200T kernel:  i915_gem_do_execbuffer+0x687/0x1a80 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? preempt_count_add+0x68/0xa0
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? _raw_spin_lock+0x13/0x30
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? _raw_spin_unlock+0x16/0x30
Apr 30 14:07:32 Thinkpad-X200T kernel:  i915_gem_execbuffer2_ioctl+0x1de/0x3c0 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? i915_gem_busy_ioctl+0x7f/0x1d0 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? i915_gem_execbuffer_ioctl+0x2d0/0x2d0 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  drm_ioctl_kernel+0xb2/0x100 [drm]
Apr 30 14:07:32 Thinkpad-X200T kernel:  drm_ioctl+0x209/0x360 [drm]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ? i915_gem_execbuffer_ioctl+0x2d0/0x2d0 [i915]
Apr 30 14:07:32 Thinkpad-X200T kernel:  ksys_ioctl+0x87/0xc0
Apr 30 14:07:32 Thinkpad-X200T kernel:  __x64_sys_ioctl+0x16/0x20
Apr 30 14:07:32 Thinkpad-X200T kernel:  do_syscall_64+0x4e/0x150
Apr 30 14:07:32 Thinkpad-X200T kernel:  entry_SYSCALL_64_after_hwframe+0x44/0xa9
Apr 30 14:07:32 Thinkpad-X200T kernel: RIP: 0033:0x7f1fd0f222eb
Apr 30 14:07:32 Thinkpad-X200T kernel: Code: Bad RIP value.
Apr 30 14:07:32 Thinkpad-X200T kernel: RSP: 002b:00007ffc96d42948 EFLAGS: 00000246 ORIG_RAX: 0000000000000010
Apr 30 14:07:32 Thinkpad-X200T kernel: RAX: ffffffffffffffda RBX: 0000564dd742b520 RCX: 00007f1fd0f222eb
Apr 30 14:07:32 Thinkpad-X200T kernel: RDX: 00007ffc96d42980 RSI: 0000000040406469 RDI: 000000000000000e
Apr 30 14:07:32 Thinkpad-X200T kernel: RBP: 000000000000000e R08: 0000000000000001 R09: 03f0028054300804
Apr 30 14:07:32 Thinkpad-X200T kernel: R10: 0015027600000000 R11: 0000000000000246 R12: 0000000000000020
Apr 30 14:07:32 Thinkpad-X200T kernel: R13: 00007f1fcf2b6000 R14: 00007ffc96d42980 R15: 00007ffc96d42980
Apr 30 14:07:32 Thinkpad-X200T kernel: OOM killer enabled.
Apr 30 14:07:32 Thinkpad-X200T kernel: Restarting tasks ... done.
Apr 30 14:07:32 Thinkpad-X200T kernel: audit: type=1131 audit(1588248452.332:180): pid=1 uid=0 auid=4294967295 ses=4294967295>
Apr 30 14:07:32 Thinkpad-X200T kernel: video LNXVIDEO:00: Restoring backlight state
Apr 30 14:07:32 Thinkpad-X200T kernel: PM: suspend exit
Apr 30 14:07:32 Thinkpad-X200T kernel: PM: suspend entry (s2idle)
Apr 30 14:07:32 Thinkpad-X200T audit[1]: SERVICE_STOP pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=wacom-inputattach@>
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: The canary thread is apparently starving. Taking action.
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TABLET: version: 625
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TABLET: x max: 26312 y max 16520
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TABLET: tilt_x max: 0 tilt_y max 0
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TABLET: pressure max: 255
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TOUCH: version: 0
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TOUCH: x max: 0 y max 0
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TOUCH: panel resolution: 10
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TOUCH: capacity resolution: 0
Apr 30 14:07:32 Thinkpad-X200T isdv4-serial-inputattach[5857]: TOUCH: sensor id: 0
Apr 30 14:07:32 Thinkpad-X200T kernel: audit: type=1130 audit(1588248452.439:181): pid=1 uid=0 auid=4294967295 ses=4294967295>
Apr 30 14:07:32 Thinkpad-X200T kernel: audit: type=1131 audit(1588248452.439:182): pid=1 uid=0 auid=4294967295 ses=4294967295>
Apr 30 14:07:32 Thinkpad-X200T kernel: audit: type=1130 audit(1588248452.442:183): pid=1 uid=0 auid=4294967295 ses=4294967295>
Apr 30 14:07:32 Thinkpad-X200T audit[1]: SERVICE_START pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=wacom-inputattach>
Apr 30 14:07:32 Thinkpad-X200T audit[1]: SERVICE_STOP pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=wacom-inputattach@>
Apr 30 14:07:32 Thinkpad-X200T audit[1]: SERVICE_START pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=wacom-inputattach>
Apr 30 14:07:32 Thinkpad-X200T systemd[1]: wacom-inputattach@ttyS0.service: Succeeded.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Demoting known real-time threads.
Apr 30 14:07:32 Thinkpad-X200T systemd[1]: wacom-inputattach@ttyS0.service: Scheduled restart job, restart counter is at 3.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Successfully demoted thread 6290 of process 1977.
Apr 30 14:07:32 Thinkpad-X200T systemd[1]: Stopped inputattach for Wacom ISDv4-compatible serial devices.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Successfully demoted thread 1848 of process 1772.
Apr 30 14:07:32 Thinkpad-X200T systemd[1]: Started inputattach for Wacom ISDv4-compatible serial devices.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Successfully demoted thread 988 of process 960.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Successfully demoted thread 987 of process 960.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Successfully demoted thread 960 of process 960.
Apr 30 14:07:32 Thinkpad-X200T rtkit-daemon[966]: Demoted 5 threads.
Apr 30 14:07:32 Thinkpad-X200T wpa_supplicant[587]: wls1: CTRL-EVENT-SIGNAL-CHANGE above=1 signal=-71 noise=9999 txrate=108000
Apr 30 14:07:32 Thinkpad-X200T wpa_supplicant[587]: wls1: CTRL-EVENT-SIGNAL-CHANGE above=0 signal=-71 noise=9999 txrate=108000

Um 14:07:05 habe ich versucht den Thinkpad zuzuklappen, zu dem Zeitpunkt war er schon eingefroren. Zwischen 13:44:55, wo noch alles in Ordnung war, und 14:07:05, wo er schon seit ein paar Minuten festgefroren war, finden sich nur wenige Zeilen:

Code:
Apr 30 13:44:55 Thinkpad-X200T systemd[1]: Started Generate mirrorlist.
Apr 30 13:52:26 Thinkpad-X200T wpa_supplicant[587]: wls1: WPA: Group rekeying completed with e8:37:7a:12:e3:03 [GTK=CCMP]
Apr 30 14:01:01 Thinkpad-X200T CROND[39527]: (root) CMD (run-parts /etc/cron.hourly)
Apr 30 14:07:05 Thinkpad-X200T systemd-logind[419]: Lid closed.

Auffallend ist, dass obwohl die grafische Oberfläche zugefroren war, weiter Log-Einträge geschrieben wurden. Vielleicht ist diesmal gar nicht die SSD das Problem sondern was anderes, was direkter mit der grafischen Oberfläche zu tun hat, zum Beispiel der Grafikchip. Ich versuche noch die Temperatur zu überwachen. Die Wärmeleitpaste wurde seit mindestens 2014, als ich den Thinkpad gekauft habe, nicht erneuert, sehr wahrscheinlich sogar noch nie. Bei einer kurzen Dauerlast (unter einer Minute) klettert die CPU-Temperatur schon auf knapp 70°C.
 
Jetzt ist er mir wieder eingefroren, die Temperatur war dabei unauffällig (kein Sensor zeigt über 60°C an). Habe mal auf einen älteren Kernel gewechselt, mit dem ich lange problemlos unterwegs war, um ein Software-Problem auszuschließen. Werde weiter beobachten und berichten.
 
Ich hatte mal mit Ubuntu ein Bug wo er ein Speicherleak hatte. Irgendwann hat er dann nur noch geswapt also wollte den RAM Füllen der Rechner ist ja dann auch Eingefrohen. Kannst wenn er Eingefrohen ist noch auf Alt F2 auf die CLI Wechseln und schauen was er dann machen? Meistens war das bei Firefox mit Flash der Fehler ist mir aber jetzt mit mein T450s nicht mehr aufgetreten.
 
Nein, ich kann leider nicht auf die TTY wechseln, das hätte Vieles einfacher gemacht... Ich kann noch die Display-Helligkeit steuern und NumLock umschalten, aber das, was ich auf dem Bildschirm sehe, ist eingefroren.

- - - Beitrag zusammengeführt - - -

Mir fällt gerade noch diese Zeile aus dem SMART-Report auf:

Code:
232 Available_Reservd_Space PO--CK   100   100   004    -    100

Das P in "PO--CK" bedeutet, glaub ich, "prefailure warning", also ist offenbar doch nicht alles im grünen Bereich. Aber jetzt hab ich doch 30GB Platz gemacht, aber dieses P ist immer noch da, hab's gerade noch mal überprüft, was ist denn da los?
 
Zuletzt bearbeitet:
Kann sein dass ich hierzu eine Info überlesen habe, aber sind Blindeingaben (wie z. B. systemctl reboot) möglich?
 
Hast du einen 2. PC/Notebook? Dann installier mal ssh auf deinem Limux und geh vom 2. PC per ssh(Putty unter Windows, falls noch ein Windows-PC vorhanden ist) auf dein Notebook, wenn die Oberfläche eingefroren ist. Falls du ein Grafikproblem (Treiber) vermutest: bootparameter nomodeset verwenden.

CAOS
 
Hab ich noch nicht getestet, aber gute Idee, teste ich, sobald er wieder einfriert!

edit: Und SSH auch! :)

- - - Beitrag zusammengeführt - - -

Bisher schaut es gut aus, offenbar lag es echt am Kernel. Sollte wieder ein Freeze auftauchen, melde ich mich noch mal, ansonsten schaut es aus, als hätten wir die Ursache das Problems gefunden.
Danke für den Input! :)
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben