Systemabsturz während Softwareupdate

Thomebau

Active member
Registriert
1 Apr. 2010
Beiträge
10.749
Hi,
ich habe auf meinem "neuen" X61 grade Ubuntu Mate installiert und die Kiste schmiert mir komplett ab.
Das erste mal ist es passiert als er noch im Abschluss der Installation die aktuellsten Updates am ziehen war.
Dabei friert sas komplette System ein, nur die WLAN Led blinkt wie angeschossen.
Selbst wenn ich den Hardwareschalter für die Funkverbindungen ausschalte blinkt sie weiter und das System bleibt eingefrohren.
Ich habe es auch etwas länger rennen lassen, aber es tut sich nichts, die einzige Möglichkeit den Spuk zu beenden ist das Gerät "hart" auszuschalten.

Ich konnte den Fehler jetzt zweimal erneut reproduzieren (die Installation habe ich nochmal neu durchlaufen lassen ohne die Updates während der Installation zu laden), indem ich nach dem Boot die Aktualisierungsverwaltung gestartet habe. Zu Beginn werden problemlos updates gezogen, bis er zu dem folgenden Bildschirm kommt und mit den oben beschriebenen Symptomen einfriert:
IMG_20170114_235446772.jpg

Hat jemand eine Idee oder einen Tip?

EDIT:
Gerade hatte ich einen erneuten Freeze mit blinkendem WLAN Lämpchen. Ich habe keine Updates durchlaufen lassen, möglicherweise hat er das aber selbstständig im Hintergrund angestoßen. Ich teste gerade mit deaktiviertem WLAN.
 
Zuletzt bearbeitet:
Eingefrorener Bildschirm statt Fehlermeldung o.Ä. ist meistens das Anzeichen einer sterbenden Festplatte.

Ich könnte noch raten, mal HDTune oder Linux-Äquivalent laufen zu lassen, aber wenn ich ehrlich bin hat das bei mir in der gleichen Situation noch nie was gebracht. Die Platte kann genausogut als funktionstüchtig erkannt werden. Ich würde ein Backup machen und abwarten.
 
Zuletzt bearbeitet:
Hmm, ich habe eine noch nicht so alte SSD eingebaut, hier mal die entsprechenden Smartdaten:

Code:
=== START OF INFORMATION SECTION ===
Model Family:     Samsung based SSDs
Device Model:     Samsung SSD 840 PRO Series
Serial Number:    XXXXXXXXXXXXXXXXXXX <- entfernt
LU WWN Device Id: 5 002538 5501c7b9b
Firmware Version: DXM06B0Q
User Capacity:    128.035.676.160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Jan 15 00:44:05 2017 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:         (65476) seconds.
Offline data collection
capabilities:              (0x53) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    No Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (  15) minutes.
SCT capabilities:            (0x003d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       4466
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -       1819
177 Wear_Leveling_Count     0x0013   096   096   000    Pre-fail  Always       -       113
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   058   052   000    Old_age   Always       -       42
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -       0
199 CRC_Error_Count         0x003e   099   099   000    Old_age   Always       -       1
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       68
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       8282682627

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
  255        0    65535  Read_scanning was never started
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Ich kann da jetzt erst mal nichts bedenkliches erkennen.

Die Kiste rennt auch grade schon wieder ca. 30 Minuten mit aktiviertem WLAN, bisher noch ohne Abstürze, evtl. sollte ich mal wieder die Updates versuchen...
 
Es kann natürlich auch ein Softwareproblem sein. Dass ein Treiber von der Distro einfach nicht passt. Aber falls Hardware gehe ich von der Platte aus, und da würden dir die SMART Werte auch nicht verbindlich sagen können ob das Teil kaputt geht oder nicht. Wenn der SSD-Controller z.B. zickt gibt das oft ein identisches Fehlerbild wie eine kaputte HDD.
 
Starte das Update mal in einer Shell per apt. Dann siehst du vielleicht noch eine Fehlermeldung. Ich hatte sowas schon auf einem T60 mit defektem RAM.
 
Ich habe jetzt einfach mal memtest laufen lassen, da ich mit Linux Mint das selbe Problem habe.
Mal schauen wie lange es dauert bis memtest nen Fehler findet.

EDIT:
Bishwr noch keine Fehler, aber der RAM läuft irgendwie nicht mit den vorgesehenen 667 Mhz.
b6a4d985808c02d140d4a575d7a79175.jpg
 
Zuletzt bearbeitet:
Der andere Riegel läuft mit 598 Mhz, was ist denn da los ?!
IMG_20170115_115400572.jpg
Fehler hat er bis jetzt aber immer noch nicht produziert.

Ich stecke den RAM gleich noch in ein T60 dass ich hier stehen habe.
 
Ich habe jetzt einfach mal memtest laufen lassen, da ich mit Linux Mint das selbe Problem habe. Mal schauen wie lange es dauert bis memtest nen Fehler findet.
Den Test wirklich mal laaange laufen lassen, so dass mindestens zwei komplette Durchgänge absolviert werden. Speicherprobleme tauchen gerne sporadisch auf.
 
Ok, ich lasse den jetzt mal bis heute Abend rennen, aber merkwürdig ist doch dass der RAM ständig mit einer anderen Frequenz läuft oder?
IMG_20170115_121335067.jpg
 
Du hast zwei Riegel drin, mindestens einer wird sporadisch nicht erkannt. Erstmal beide aus- und wieder einbauen, ggf. tauschen. Wenn es immer noch nicht funktioniert, jeden einzeln testen. Wenn es bei einem zu Problemen kommt, weg damit.
 
Ich hab die erst mal einzeln getestet, falls einer schon im ersten Durchlauf Fehler produziert, das war schon richtig so ;)
 
So, auch nach 10 Durchläufen kein Fehler.
Ich habe allerdings entdeckt dass da eine Intel 5100 drin steckt (ohne FRU). Ich habe den Verdacht dass das eine von den China-Wlankarten ist die unter Windows problemlos laufen, aber unter Linux nicht.
Ich versuche es mal mit einer Atheros die noch hier liegt und wenn immer noch Fehler auftreten lasse ich memtest mal 24h laufen.
 
Lasse sie doch einfach mal draußen und gehe über Ethernetkabel. - Geht schneller und ist preiswerter ;)
 
So, auch mit der andere Karte hat die Kiste irgendwann während der Installation gehangen, allerdings nicht so wie zuvor.

Daher habe ich über Nacht memtest laufen lassen und siehe da:
IMG_20170116_174848966.jpg

Wieder in meiner Wohnung angekommen habe ich versucht die Installation mit nur einem Riegel zu machen um herauszufinden welcher der beiden der fehlerhafte ist, dabei hat sich die Installation zwar nicht aufgehängt, aber beim reboot gibt es einen TPM error ?!
IMG_20170116_202745829.jpg

Und memtest hat dann auch grade im ersten Durchlauf einen Fehler produziert...
IMG_20170116_203909895.jpg

Um das zu verifizieren teste ich jetzt den anderen (hoffentlich intakten) Riegel nochmal einzeln über Nacht.
 
Zuletzt bearbeitet:
An der software - ubunutumate-16.04 - wird es wohl nicht liegen.
Auf meinem T60 not any problems damit
aber vllt ist dein tp allergisch gg ubuntu?:thumbsup::thumbsup:

Den tmpError bekomme ich beim booten von HDD, in opensuse und ubuntu: vergiss ihn. Das system bootet weiter
 
Eben nicht, das System bleibt entweder nach dem TPM Error stehen oder es wirft mich direkt in eine shell.
 
Gibt drei Möglichkeiten:

1. TPM im BIOS aktivieren
2. TPM im BIOS deaktivieren
3. echo "blacklist tpm_tis" | sudo tee /etc/modprobe.d/tpm_tis.conf

Das Booten sollte dadurch aber eigentlich nicht unterbrochen werden.
 
Kann es sein das ubuntu aktuell fehlerhafte isos online hat?

Kann ich mir eigentlich nicht vorstellen bei so ner großen distro, aber meine versuche ubuntu auf meinem X1 zu installieren blieben auch alle nachdem ich das Passwort für die Verschlüsselung gesetzt hatte hängen und so wie ich Thomebau verstehe verreckt da auch schon die Installation?

Bei mir ist möglicherweise auch irgendwas mit der SSD, aber SMART ist auch Problemlos durchgelaufen, wie auch nachdem ich ubuntu aufgegeben hab eine fedora installation.
 
Das Gerät friert auch mit dem anderen RAM Riegel vollständig ein. Ich versuche es jetzt noch einmal mit einer anderen HDD und wenn die die selben Symptome zeigt wie meine SSD dann bin ich mit meinem Rat am Ende.
Mitten während ich irgendwas am machen bin bleibt das System einfach stehen, keine Fehlermeldung, keine blinkenden LEDs mehr, einfach eingefrohren :/
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben