PC stürzt ab - mal mit, mal ohne Bluescreen

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Seit dem 29.11.2022 stürzt mein PC häufig ab und startet selbsttätig neu, gelegentlich mit dem Fehler „WHEA_UNCORRECTBLE_ERROR“, meistens jedoch ohne Bluescreen.
Der Fehler tritt anscheinend zufällig auf und ist nicht gezielt reproduzierbar.
Ich habe bereits Windows inkl. aktueller Updates und den NVIDIA Treiber neuinstalliert, jedoch besteht das Problem weiterhin.
Laut CHKDSK scheint es keine Probleme mit den SSDs und der HDD zu geben. Den Arbeitsspeicher habe ich, nachdem sich der Test mit Memtest86 bei jedem Durchlauf nach kurzer Zeit aufgehängt hatte, bereits getauscht und auch das XMP Profil deaktiviert. Allerdings hat auch das das Problem nicht gelöst.
Die übrige Hardware wird problemlos erkannt und funktioniert laut Windows (angeblich) einwandfrei.

Das Problem tritt sowohl beim Spielen als auch im „normalen“ Betrieb auf (Idle im Sperrbildschirm, Surfen etc.).

Die letzte Änderung, die ich vor dem ersten Auftreten des Problems vorgenommen habe, war die Installation des Spiels „Age of Empires 4“. Nach dem das Problem auftrat, habe ich es wieder deinstalliert, aber das Problem wurde dadurch nicht behoben.

Ich habe auch getestet, ob das Problem auch auf meinem zweiten OS Debian 10 auftritt. Auch hier stürzt der PC nach einem zu dem vorhin beschriebenen ähnlichen Muster mit anschließenden Neustart ab, allerdings konnte ich hierfür keine Erklärung, bspw. In Form eines Eintrages in syslog, finden.

Ich habe den Verdacht, dass möglicherweise mein Mainboard defekt sein könnte.
Hat hier jemand mit diesem oder ähnlichen Problemen bereits Erfahrungen gemacht?
Habt ihr Ideen, wo das Problem liegen könnte und wie ich es lösen kann?

Mein System:
Intel i7 9700K
ASUS Z390-P (Motherboard)
NVIDIA GTX 1070
64GB DDR4 RAM (3200 MHz mit XMP)
Windows 10 / Debian 10 (Beide Betriebssysteme liegen auf jeweils unterschiedlichen und funktionsfähigen SSDs)
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Moin. Welches Netzteil hast du im Einsatz? Prüfe auch mal mit HWINFO deine Temperaturen von CPU und GPU. Geht gut mit dem Demo von 3DMark Timespy
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Danke für die Empfehlung.

Mein Netzteil ist ein be quiet! Straight Power 11 mit 750W und einer 80PLUS Platinum Zertifizierung. Es ist seit August dieses Jahres im Einsatz.

Ich habe den Benchmark mehrfach ausgeführt und jedes Mal kam es währenddessen zu einem erneuten PC-Absturz. Die GPU schien bei zwei Durchläufen vergleichsweise heiß zu werden (siehe Bilder). Die CPU-Temperaturen hingegen schienen meiner Ansicht nach unauffällig zu sein.
Der PC ist allerdings auch schon vor dem Benchmark abgestürzt und die Höchsttemperaturen der CPU und GPU lagen zu dem Zeitpunkt jeweils unter 70°C.
Mit dem Benchmark lässt sich das Problem anscheinend zuverlässig reproduzieren.
 

Anhänge

  • 74F2561A-E568-4123-9520-AF4744A05B99.jpeg
    74F2561A-E568-4123-9520-AF4744A05B99.jpeg
    3,9 MB · Aufrufe: 6
  • 628D84EB-5209-41A6-A484-1FFD2E9160C6.jpeg
    628D84EB-5209-41A6-A484-1FFD2E9160C6.jpeg
    3,9 MB · Aufrufe: 5

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Der Hotspot der GPU ist hoch. Aber wenn du die Probleme auch im normalen Betrieb hast wo keine Graka im Einsatz ist wirds daran wahrscheinlich nicht liegen. lad dir mal OCCT runter und mach dn Powersuply test. wenn der Rechner abschmiert protokoliert occt das und man kann es sich anschauen
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Ich hoffe, ich habe den richtigen Test erwischt.
Der Test hat ganze 9 Sekunden gedauert bevor der PC sich wieder verabschiedet hat.
 

Anhänge

  • 5906B610-D4ED-448D-9348-1390F0F9CC19.jpeg
    5906B610-D4ED-448D-9348-1390F0F9CC19.jpeg
    2,8 MB · Aufrufe: 6

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Hat dir OCCT eine Diagnose ausgespuckt? Die Files findest du auf c:/user/Dokument /occt
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Leider nein. Mehr als „Last known status“ beim nächsten Start von OCCT bekomme ich nicht. Und selbst den kriege ich nicht immer.
Die Tests scheinen immer kurz nach oder bei Erreichen der maximalen Auslastung von CPU und GPU zu enden, was keine 10 Sekunden dauert. Vielleicht ist das zu kurz für einen Report?!
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
dann mach mal Bilder von Temp, Voltage und Power vom last known status
Doppelpost zusammengeführt:

Du musst das Monitoring in occt aktivieren.
Doppelpost zusammengeführt:

Zu finden bei den Tests, ich probier bei mir mal, die neuste Version von occt ist mir nicht so geläufig
Doppelpost zusammengeführt:

Es gibt einen bluscreenviewer zum download, mach mal drauf und lese die bluescreens aus.
Doppelpost zusammengeführt:

Ahh habs. Du brauchst OCCT 4.5 damit alles Aufgezeichnet wird
 
Zuletzt bearbeitet:

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Es ist mir tatsächlich gelungen, einen 30 Minuten Test vollständig durchzuführen. Allerdings habe ich auch hier keinen Report erhalten, weshalb ich Bilder von Temp, Voltage und Power direkt nach Ende des Tests gemacht habe.

Wieso genau der Test plötzlich doch länger als 10 Sekunden funktioniert hat, weiß ich nicht. An der Konfiguration (Hardware und Software) habe ich zwischenzeitlich nichts geändert.

Etwa drei Minuten nach dem Test ist das System mit „WHEA_UNCORRECTABLE_ERROR“ abgestürzt.
 

Anhänge

  • C7A01483-7456-4D92-B145-CDC325450274.jpeg
    C7A01483-7456-4D92-B145-CDC325450274.jpeg
    3 MB · Aufrufe: 4
  • 8D7FF821-9295-478F-971D-28DEFE6D9732.jpeg
    8D7FF821-9295-478F-971D-28DEFE6D9732.jpeg
    3 MB · Aufrufe: 4
  • 3B0A4B56-6C16-4771-A73E-A05127C012C3.jpeg
    3B0A4B56-6C16-4771-A73E-A05127C012C3.jpeg
    2,1 MB · Aufrufe: 4

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Dein CPU läuft barbarisch heiss. 100*C notaus
Doppelpost zusammengeführt:

Welchen kühler nutzt du?
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Ich nutze den be quiet! Pure Rock 2 (TDP 150W) und das ebenfalls erst seit August.
Zu dem Zeitpunkt hatte ich auch die Wärmeleitpaste zuletzt erneuert.

Bluescreen Dumps wurden die Male, die das vorkam, anscheinend nicht erstellt. Die Suche nach Fehlerinformationen erreichte allerdings selbst nach einer Stunde nicht mehr als 0%.
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Der Pure Rock sollte es eigentlich schaffen. Vielleicht hast du ihn nicht richtig aufgeschraubt, wie gut ist deine Gehäuselüftung?
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Ich habe neben dem CPU-Kühler zwei Gehäuselüfter (der zweite ist nicht auf dem Bild, sitzt jedoch neben der HDD).
Das Gehäuse verfügt über eine Art Mesh-Front, wodurch der zweite Gehäuselüfter Luft von außen anziehen kann, welche von dem neben dem CPU-Kühler hinausgeleitet wird.
Diese Gehäuselüfterkonfiguration besteht so bereits seit sechs Jahren und hatte bisher keine ersichtlichen Probleme gemacht.

Der CPU-Kühler scheint richtig zu sitzen. Wärmeleitpaste ist auch noch reichlich vorhanden. Beim Herausnehmen und Einsetzen der CPU konnte ich keine Verunreinigungen oder Beschädigungen feststellen.
 

Anhänge

  • 9A31BA09-EA4C-40FD-AE46-7F284938BC30.jpeg
    9A31BA09-EA4C-40FD-AE46-7F284938BC30.jpeg
    2,1 MB · Aufrufe: 2
  • E8CF4BEA-5916-460F-BBE7-0DACB00AF9A9.jpeg
    E8CF4BEA-5916-460F-BBE7-0DACB00AF9A9.jpeg
    2,6 MB · Aufrufe: 2

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Dann mal Cinebench 32 installieren. HWInfo Sensoren öffnen und Cinebench starten. Dann mal auf die Drehzahl des CPU Lüfters achten ob diese steigt wenn der CPU heiss wird.
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Ohne Test läuft der Lüfter wohl zwischen 400 und 650 RPM. Während des Tests dreht er beim ersten Durchlauf kurz auf ca. 1500 RPM auf und bleibt danach für die Dauer des Tests zwischen 900 und 1300 RPM.
Die CPU wurde anscheinend nicht wärmer als 85°C.
 

Anhänge

  • 0D978D4F-80D3-478E-8BD0-27F6E60F3DBA.jpeg
    0D978D4F-80D3-478E-8BD0-27F6E60F3DBA.jpeg
    2,5 MB · Aufrufe: 1

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Dein Pure Rock müsste max 1500 umi schaffen. Geh mal in dein Mainboardbios und schau wie er eingestellt ist. Silent oder power oder oder
 

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Der steht derzeit auf „Standard“. Ist es empfehlenswert, das mal umzustellen?
Bei der Einstellung „Turbo“ würde der bspw. schon ab ca. 60°C auf 100% gehen.
 

Anhänge

  • 37416753-B324-4C40-AD41-D8D28FC41FB0.jpeg
    37416753-B324-4C40-AD41-D8D28FC41FB0.jpeg
    3,5 MB · Aufrufe: 1

felixfelicis

Mitglied
Themen-Ersteller
Dez 7, 2022
12
0
Ich habe den Lüfter erstmal auf „Turbo“ gestellt.
Leider habe ich immer noch temperatur- und auslastungsunabhängige Abstürze.
Zunächst sah es so aus, als hätte das Aus- und Einbauen der CPU das Problem behoben, da ich danach mehrere Benchmarks und Spiele ohne einen einzigen Absturz ausführen konnte.
Aber seit heute Morgen stürzte das System wieder ab.
Ein erneutes Aus- und Einbauen der CPU und auch ein Zurücksetzen der BIOS-Einstellungen haben leider nicht zum Erfolg geführt.

Seit dem letzten Absturz komme ich mittlerweile nicht einmal mehr ins BIOS.
Der PC lässt sich zwar noch einschalten, aber es gibt weder einen Piepton noch ein Bild. Er piept nicht mal dann, wenn ich den Arbeitsspeicher komplett ausbaue, was er zuvor sonst eigentlich immer gemacht hat.
Die LED-Streifen des MB und die GPU leuchten allerdings noch.

Wo könnte hier das Problem liegen? Sind vielleicht die CPU und/oder das MB defekt? Oder muss ich den Fehler woanders suchen?
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.017
2.288
Gute Frage. Kann alles sein was den Geist aufgegeben hat. Du hast leider keine Möglichkeit Quer zu testen. Bleibt dir nur der Gang zum Experten um die Ecke. Gerne gehen beim ein und ausbau der CPU die Pins oder Ferdern kaputt oder es läuft Wärmeleitpaste in den Sockel. Der Anpressdruck spielt auch eine Rolle. Ich stelle den Kühler beim Testen nur auf den CPU und verschraube ihn nicht, hab extra nen Kühler ohne Klammern.