Gelöst Beim spielen in 4K zufällige Bluescreens „system_service_exception“ mit unterschiedlichen crash quellen nach maximal 5 minuten

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Schönen Montag euch allen!

Erstmal mein System:

Asus Rog X570f mit aktuellstem BIOS
Corsair Vengeance LP DDR 4 Ram 4x8gb auf 3200mhz, D.O.C.P. Aktiv
Ryzen 5900x stock
Msi RTX4090 gaming x mit dem 12VHPWR Adapter angeschlossen, kein PCIE5.0 Kabel
Seasonic Prime TX1000
System auf einer nvme ssd, Spiele auf einer Sata SSD

Das Problem fing vor ein paar Wochen an, mit meiner 6900XT, welche ich vorher hatte. Wenn ich über HDMI auf meinem TV in 4k spielen wollte, bekam ich immer wieder Bluescreens mit unterschiedlicher Fehlermeldung. Diese kann ich leider nicht mehr rekonstruieren. Das ging so weit, dass meine 6900XT eingeschickt werden musste, weil nach einem Fehler ein Display Port Ausgang nicht mehr funktionierte. Der Fehler ist gewandert, deshalb gehe ich von einem Defekt aus.
Da ich eh die Schnauze voll von AMD GPUs hatte, weil ich auch VR Spieler bin, und das leider nur etwas dürftig mit AMD Grafikkarten in Verbindung mit einer Quest 2 funktionierte, bin ich nun wieder auf Nvidia gewechselt. (Versteht mich nicht falsch, die AMD Karte war Bombe mit der rohen Spieleleistung, hat nur nicht die Features, die ich brauche mit der Quest)

Nun denn, RTX4090 gekauft und eingebaut, Windows frisch installiert, Treiber aktualisiert und drauf los.
So weit, so fein alles funktioniert, solange ich auf meinem Hauptmonitor mit 1440p 165hz spiele. Zumindest hatte ich bisher damit noch keine Probleme.

Sobald ich aber über meinen TV, angeschlossen mit HDMI 2.1, spielen möchte, beginnt der Spaß. Nach meist nichtmal 5 Minuten bekomme ich Bluescreens, meist mit „System_Service_Exception“ und caused by driver: ntoskrnl.exe, mal auch nvdll, dxgkrnl, ntfsys oder dxgmm2 (ganz genau kenn ich die Bezeichnungen nicht mehr)

Laut nvidia Overlay sind die Komponenten kurz vor dem Bluescreen normal ausgelastet (95-99%GPU, 20-40%CPU, Temperaturen relativ normal)
Beim letzten Bluescreen, welchen ich kurz vor dem Verfassen dieses Posts hatte, waren sogar Grafikartefakte zu sehen. Das hatte ich auch schon mit der AMD GPU, nur teils schlimmer.
Über sfc /scannow findet das System auch nach jedem Bluescreen defekte Dateien und ersetzt sie. Teilweise startet Windows nach manchen Bluescreens auch nicht mehr, da heißt es, das System sei corrupt.
Wenn der PC nicht startet nach einem BSOD leuchtet die „DRAM“ led am Mainboard.
Ich lasse in diesem Moment die Windows Speicherdiagnose auf erweitert durchlaufen, ich befürchte aber, dass dies keine Fehler findet, das war zumindest beim letzten Durchlauf der Fall.
Da mir die Minidump files so gut wie garnichts aussagen für einen „Leien“ wie mich, gibt es auch nicht wirklich brauchbare Google Ergebnisse, außer „aktualisiere Treiber“ etc. Diese sind aber immer auf aktuellstem Stand bei mir.
Das einzige, was mich beunruhigt, ist aber auch, dass es bei den Suchergebnissen immer wieder auf den RAM hinweist. Ich würde mich aber sehr wundern, warum diese Aussetzer dann meist nur beim spielen in 4k auftritt. Ich habe leider keine Möglichkeit die Ram Sticks einzeln zu testen, da ein Dark Rock Pro4 auf dem CPU sitzt und ich diesen dann für jeden Ram Stick demontieren müsste.
Es muss ja allem Anschein nach eine der Komponenten sein, welche nicht getauscht wurden, sprich CPU oder Ram.
CPU ist keine 2 Jahre alt, Ram ist 4 Jahre alt, genauso wie das Mainboard.
Inwiefern kann Ram kaputtgehen, dass solche Fehler, mit ständig unterschiedlichen Fehlerquellen, und auch nur beim spielen in 4k auftreten?
Oder bin ich komplett auf dem Holzweg?
Bei Bedarf würde ich nach der Speicherdiagnose auch die Minidump Files hochladen.

Ich hoffe irgendwer kann mir helfen, dass ich gewissheit habe, was nicht stimmt. Wäre schließlich schade, wenn ich nicht mit einer 4k GPU in 4k spielen könnte.

Liebe Grüße und einen schönen Restmontag!
c00r5
 
Zuletzt bearbeitet von einem Moderator:

Zaradur

Ehrenmitglied
Dez 10, 2022
2.243
1.013
Also die Bluescreens deuten schon auf Treiber Probleme hin.
Aber da du ja auch mit der AMD Karte dieselben Probleme hattest wird es bei der AMD Karte ja sehr wahrcheinlich nicht der Nvidia Treiber gewsen sein.^^

Vom Prinzip her wäre es möglich das es der RAM ist.
Der ist diesmal aber nicht mein Hauptverdächtiger.
Sehr oft kommt aus bei RAM Problemen auch direkt zu nem Neustart.
Wenn du den RAM testen willst nimm lieber Memtest 86 ist zuverlässiger als die Windows Diagnose.

Ich habe irgendwie die SSD/NVME in verdacht.
Wenn die nen Problem hat kann es auch zu ganz merkwürdigen Fehler kommen.
 
  • Gefällt mir!
Reactions: Schakara

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Hi!
Erstmal danke für deine Antwort! Die Speicherdiagnose ist durchgelaufen und hat, wie zu erwarten, keine Fehler gefunden. Ich lasse jetzt erdtmal MemTest durchlaufen und schaue dann weiter. Ich lade erstmal mit dieser Antwort auch die Minidumpfiles hoch!
Liebe Grüße!
 

Anhänge

  • Minidump.zip
    1,6 MB · Aufrufe: 1

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Guten morgen!
Memtest86 hat einen erfolgreichen Pass hinter sich. Prime95 lief auch etwas über 15 min ohne Probleme durch (CPU und RAM).
Furmark für die GPU macht auch keine mucken. Volle 450W zieht die GPU ohne Fehler.
Was mir gestern noch aufgefallen ist: der Fehler tritt ja nur beim spielen auf dem TV auf (So der Eindruck). Kann es sein, dass der HDMI Slot vom TV ein Fehlersignal ausgibt und der PC dadurch crasht?
Bei meiner 6900XT ist nämlich auch der Signalausgang am Ende defekt gewesen, wo der TV angeschlossen war. Wobei bei der GPU der Defekt und der vorherige Crash nicht beim Spielen auf dem TV passierte.
Jetzt bin ich langsam überfragt… Hat man denn keine Möglichkeiten, die Minidumps mal vernünftig auszulesen? Ein Nicht-Informatiker kann mit dem ganzen Zeug von Bluescreenview ja garnichts anfangen.

Liebe Grüße
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.111
2.304
Wenn die HDMI Versionen sich beißen kommt es schon mal vor das es Abstürze gibt, aber das es gleich den Port killt? Dann müsste der TV Ausgang einen Schaden haben und eventuell zuviel Spannung auf den Port legen. Aber ob man das ausmessen kann?
Laut Google!
An Pin 18 von jedem HDMI-Anschluss liegt eine 55 mA / 5 V-Speisespannung, um diverse elektronische Teile, Geräte, Anwendungen mit Spannung zu versorgen.
 

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Ich werd heut Abend nach Feierabend mal die HDMI Ports wechseln. Der TV hat einen älteren HDMI Standard für 4k60. Kabel hat HDMI2.1 und GPU Ports logischerweise auch. Vielleicht reicht es ja schon, den HDMI Port zu wechseln, denn soweit ich mich erinnere, ist der HDMI 1 Port am TV, der im Moment am PC angeschlossen ist, auch der ARC Channel. Aber ich kann mir nicht vorstellen, dass dort irgendwas falsch läuft, Es ist nur der einzige Faktor, der mir so in den Sinn kommt, denn der TV wird ausschließlich fürs 4k spielen genutzt, wo die Abstürze ausschließlich bisher, seit der Neuinstallation, vor kamen.

Liebe Grüße
 
  • Gefällt mir!
Reactions: Zaradur

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Logbucheintrag 5 vom 05.09.2023

Ich habe getestet, und zwar mit 3d mark, weil ich einfach mal wissen wollte, ob es an der Auflösung oder ähnlichem liegt. Ergebnis ernüchternd.
Tests auf dem TV mit 4k Auflösung, HDR deaktiviert, VRR deaktiviert, weil TV es nicht unterstützt. TV als Hauptbildschirm geschaltet.
Time Spy Extreme lief ohne Probleme durch, das hat aber leider nichts zu bedeuten.
Nächster Versuch mit Port Royale wegen Raytracing: BSOD
Noch ein Versuch: BSOD
Ein Versuch mit Speed Way: Ein durchlauf in Ordnung, nächster Durchlauf BSOD
mit anschließendem Loop der automatischen Reparatur, nur Reset möglich

Wechsel auf 1440p Monitor, TV deaktiviert, DSR auf 4k Auflösung
Port Royale: BSOD


Bios auf Werkseinstellungen gestellt wegen Ram Takt und Wechsel auf 1440p Auflösung
Port Royale Stresstest: BSOD nach Durchlauf 2-3 (ca 5 min)

Anschließend wieder im Bios den Ram Takt auf D.O.C.P. gestellt
Speedway Stresstest: Bei Loop 5-6 BSOD (ca 5-7min)

Nach dem letzten BSOD, der auch nicht mehr gespeichert wurde, hat der PC nicht mehr automatisch neugestartet, sondern blieb einfach aus. Erneutes einschalten kein Problem.

Wiedermal ganz unterschiedliche BSOD Meldungen, aber alle mit Driver Cause "ntoskrnl.exe". Danke Windows 10, das hilft alles richtig weiter.
Ich verstehe nicht, dass es nicht möglich ist, vernünftige Aussagen über solche Crashes zu machen, sodass ein "Hobby-Systemintegrator" wie ich auch weiß, wo er überhaupt anfangen soll zu suchen.

Ich habe auch mal Crystal Info laufen lassen. Alle SSDs und HDDs, bis auf meine älteste HDD (12 Jahre alt, 72000 Bestriebsstunden) in Ordnung, Crystal Mark ist auch in Ordnung für die Systemplatte.

Anzumerken ist auch, dass das System im Idle teils über Tage stabil läuft, es tritt nur auf, wenn die Komponenten, wie jetzt bei den 3dMark Tests, gefordert werden. Das Netzteil ist etwas über ein Jahr alt und ist doch schon ein sehr teures Seasonic, deshalb bin ich eigentlich davon überzeugt, dass dies nicht zusammenbricht, zumal der Fehler sich dann anders darstellt, oder?

Schönen Abend noch!
 

Anhänge

  • Minidump05_09_23.zip
    1.003,8 KB · Aufrufe: 0
  • Gefällt mir!
Reactions: Schakara

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.111
2.304
Also liegt es nicht am TV. Das ist doof aber eine Fehlerquelle weniger. Was ist wenn dein 5900x dein Mainboard unter Last, in zusammenspiel mit der Anderen Hardware überfordert? Mal undervolting probiert am CPU?
Hast du nur den 8Pin EPS/CPU gesteckt oder den 4er gleich dazu?
 
Zuletzt bearbeitet:

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Ja, 8+4 Pin ist angeschlossen.
Das könnte ich ja alles verstehen, wenn diese Probleme nicht schon vorher mit der 6900XT auftraten, obwohl das gleiche System seit 2 Jahren davor absolut problemlos lief, bis auf die bekannten Treiberprobleme bei AMD.

Prinzipiell hab ich interesse an undervolting der CPU, gerade weil es bei AMD ja auch stabilität etc bringt, weil die dinger ja auf 1.45V stock laufen. Traue mich aber nicht ans BIOS bzw. Hab ich absolut keine Ahnung, wie man das stabil und effektiv einstellt. Gerade, weil ich bisher immer das Pech mit allen CPUs hatte, dass die wohl schlechte samples waren. Habe es schon mehrmals mit dem Clock Tuner for Ryzen probiert, der hat aber noch nie bei meinem 5900x einen Durchlauf mit vernünftigem Ergebnis erreicht.

Ich hätte so gern einen klaren Grund für die Bluescreens. Was gäbe es denn noch für Testmöglichkeiten? Stresstests habe ich ja eigentlich alle durch. Treiber sind aktuell (zumindest laut Asus Website des Mainboards), Programme wie Driver Booster finden ja immer aktuellere Treiber, aber von den Programmen bin ich kein Fan, zumindest nicht bei meiner Maschine.

Es irritiert mich einfach sehr, dass diese Probleme vor ein paar Wochen von jetzt auf gleich anfingen und sich über die 6900XT, einer GTX1660 und jetzt der 4090 hinwegziehen. Sonst wurde nichts im Setup geändert, ausgebaut etc. Windows fresh install hat ja offensichtlich nichts gebracht, da ich auch erst Treiberprobleme vermutet habe. Das die BSODs auch ständig unterschiedliche Ursachen haben macht die Sache schlimmer. Heute hatte ich z.B. 2 mal Memory Management und 1 mal PFN List Corrupt. Die hatte ich bisher noch nicht.

Grüße
Doppelpost zusammengeführt:

Falls sich wer fragt, wo jetzt die 1660 herkommt: Das war die Übergangs GPU, mit der ich aber so gut wie nicht gespielt habe, nachdem ich mit der auch BSODs hatte. Daher auch der Windows fresh install. Habe ich leider verdrängt zu erwähnen.
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.111
2.304
Schon mal mit dem Tool OCCT V4.4 und V12 gearbeitet? Diagnosetool mit Hintergrundaufzeichnung , jedenfalls die V4.4. Und mit etwas Übung kann HWinfo auch sehr mächtig sein. Das zeichnet auch alles per Graphen auf und mit einem extra Tool kann man es nach dem Bluescreen analysieren.

man kann so ziemlich alles Sensoren ins Verhältnis zu einander setzen und so sehen ob irgendwo ein Sensor was komisches meldet und daraufhin was anderes den Betrieb einstellt
 

Zaradur

Ehrenmitglied
Dez 10, 2022
2.243
1.013
Mir gehen auch langsam die Ideen aus.
Mir ist aber jetzt noch aufgefallen das du ja 4 RAM Riegel nutzt.
Du könntest einfach mal nur 2 Riegel versuchen.
Vollbestückung kann manchmal zu komischen Fehler führen.
 

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Ram ausbauen wäre aufgrund des Dark Rock Pro 4 leider echt ein riesen Aufwand…
Ich habe heute auch mal aufgrund eines Tipps mal die CMOS Batterie getauscht nach 4 Jahren.
Folgende Dinge:
Heute Morgen habe ich OCCT 4.4 auf Full Power Supply Test laufen lassen. Gute 10 min war es stabil, dann gab es einen Bluescreen mit anschließenden Problemen des Startens.
Alles an Peripherie schaltete sich ab, Bildschirme schwarz, PC lief aber lauf LED Indikatoren.
Reset Schalter brachte das System wieder zum hochfahren, Peripherie lief wieder, jedoch gab es auf Bildschirm 1 einen schwarzen Bildschirm mit Artefakten, auf Bildschirm 2 ein rein blaues Bild, Bildschirm 3 zeigte normales Bild. Keine Reaktion auf Eingaben mit Maus und Tastatur.

Ich habe einmal sämtliche USB Geräte abgesteckt, nur Maus und Tastatur nicht, einmal alle Bildschirme, bis auf den Haupt 1440p Monitor abgesteckt.
Nvidia Treiber per DDU im Safe Mode deinstalliert, nach neustart neuinstalliert, Chipsatztreiber nochmal installiert (Stand September 22), keine aktuelleren von Asus zum Download verfügbar.

3D Mark Stresstest verursacht weiterhin Bluescreens, OCCT ebenso. Furmark habe ich nicht nochmal getestet.

Jetzt habe ich getestet, nachdem ich alle Geräte wieder angesteckt habe:

Cyberpunk maximal Settings (Pathtracing, mit und ohne DLSS) auf 1440p, per DSR auf 4k und auf 2880p in der JigJig Street mit 4k Texturmod (volle VRAM Auslastung) mit max NPCs und Raytraced lightning

1h lang mit Wechsel der Auflösung absolut keine Probleme.

RDR2 max Settings 4k DSR ohne DLSS
15min ohne Probleme

Ratchet and Clank Rift Apart 4k DSR, max Settings mit RT kein DLSS
Läuft jetzt auch seit 15 min ohne Probleme

Die RIESENGROSSE Frage, die ich mir nun Stelle ist:
Warum habe ich nur Probleme bei synthetischen Benchmarks wie 3D Mark
Und
Bei einem Full OCCT Test, Wobei ich es da auch auf den GPU Test schiebe, da alle separaten Stresstests problemlos
Und
Wenn ich auf meinem TV spielen möchte

Die getesteten Spiele sind die, mit denen ich die Probleme hatte, anderes noch nicht getestet.

Eine Frage noch dazu:
Macht es Sinn mit dem System auf Windows 11 zu wechseln, um mögliche beschädigte Systemdateien (trotz fresh win install) und Treiber Problemen aus dem weg zu gehen? Sträube mich sehr gegen win 11, ich finde das OS schrecklich
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.111
2.304
Hast du noch ne alte SSD rum liegen? Mach do da mal Win11 druf und probiere. Ich tippe aber eher auf einen CPU Schaden. Kommunikations Problem unter Last. Du solltest Prime95 mal paar Stunden laufen lassen.
 
  • Gefällt mir!
Reactions: Schakara

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Rumliegen hab ich keine, ne, aber ich könnte eine meiner 256er sata ssds opfern dafür, ist eh nichts drauf. Werde morgen mal prime über den Arbeitstag laufen lassen.
 
  • Gefällt mir!
Reactions: MetallicaSun

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Stand 7.9. 20.24 uhr

Firmware NVME geupdated, windows driver verifier laufen lassen, hat nur einen Treiber gefunden, der ihm nicht gefällt, nämlich Virtual Clone Drive.
Signaturprüfung durchlaufen lassen, Fast boot disabled
Keine besserung

Windows 11 mittels media creation tool auf bootstick auf einer anderen sata ssd installiert, alle updates durchlaufen lassen, die absolut nervige einrichtung mit 72mio abo angeboten durchgemacht, nur chipset treiber und Grafiktreiber installiert

3D mark installiert und getestet: BSOD IRQL less or equal in einen
BIOS Crash mit roter LED am Mainboard bei CPU, das hatte ich ja noch nie!
Warnung mit der Aussage, ich solle doch bitte einen Stick oder DVD mit der BIOS File winstecken und resetten.
Dies gemacht, ich hatte gottseidank noch den Stick mit der BIOS File auf dem Schreibtisch, und ohne nochmal etwas bezüglich des BIOS zu meckern ist der PC in die Betriebssystemauswahl gebootet. Nochmaliger Versuch endete in einen BSOD mit anschließendem schwarzen Bildschirm mit LED an dem Punkt VGA am Mainboard. Ich glaub ich kann fehlerhafte Treiber ausschließen, es scheint doch Hardware zu sein. Aber es kann ja alles von Mainboard, über Ram, PSU und Cpu, sogar die nagelneue 4090 sein. Ich werd langsam sehr traurig.

Jetzt läuft erstmal Prime95 seit ner Stunde Fehlerfrei auf CPU und Ram.
 

MetallicaSun

Ehrenmitglied
Okt 3, 2022
10.111
2.304
Las Prime mal laufen. Das Tool ist sehr gründlich wenn man ihm Zeit gibt. Bei der GPU würde ich doch eher sagen das sie es nicht ist, deine anderen GPUs haben den selben Fehler mit gemacht. Wenn Prime nix findet und Memtest86 per USB Stick auch nichts findet dann kann der Mainboardchip nen Knall haben aber ich kenne kein Tool was diesen prüfen könnte
 

Schakara

Moderator
Mitarbeiter
Dez 13, 2022
2.509
1.579
Moin. Ich Klinke mich auch mal ein.

Erstmal props an den TE, solch ausführliche Fehlerlogs liest man unheimlich gerne und auch wenn du dich selbst nur als "Hobbysystemintegrator" bezeichnest so ist dein Troubleshooting + Dokumentation auf höchstem Niveau.

Zum Fehler - merkwürdig.. Tendenziell könnte es alles sein, jetzt werfe ich aber mal etwas anderes in den Raum, was ich bisher noch nicht gelesen habe. Könnte es sein, dass dein Mainboard einen weg hat? BSODs die dich im Anschluss ins Bios holen klingen für mich höchst verdächtig.

Hast du ggfs. Die Möglichkeit, deine Hardware Stück für Stück an einem anderem Pc zu Testen? (Vllt hast du ja einen Freund mit AM4 System, der dich etwas unterstützt)

Da die Fehler ja sehr fix kommen würde ich Komponente für Komponente an einem zweiten Pc testen, sobald Fehler kommen hättest du die Ursache gefunden.. und falls keine Kommen ist es mit an Sicherheit grenzender Wahrscheinlichkeit das Mainboard 🙂✌️

Viele Grüsse
 

c00r5

Mitglied
Themen-Ersteller
Sep 4, 2023
16
7
Guten Morgen!
Prime lief gestern für den Rest des Abends sauber durch.
@MetallicaSun und @Schakara tatsächlich bin ich mittlerweile auch auf dem Pfad des Mainboards unterwegs, deshalb hab ich mir gestern noch ein MSI Torpedo bestellt. die Auswahl an x570 Boards ist mittlerweile ja wirklich sehr eingeschränkt, sofern man nicht 300€ aufwärts ausgeben möchte.
Dies geschah mit purer Absicht auf Amazon, denn dort kann ich es sehr komfortabel zurückschicken, wenn es nicht so sein sollte. Da ich auch nicht unendlich Geld habe, gerade nach der Anschaffung der 4090, muss ich dieses System leider ausnutzen.

Samstag wird es kommen, eventuell werde ich dann schon umbauen (Eigentlich gehts zum Mittelalter Markt mit der Frau ;) )
Ansonsten wird es wohl am Sonntag einen Statusbericht geben!

Schönes Wochenende schonmal!

PS: Freut mich, dass meine Dokumentation okey ist! Da ich Radio und Fernsehelektroniker bin, ist das fast normale Vorgehensweise für mich, wenn ich ehrlich bin :D
 
Zuletzt bearbeitet:
  • Gefällt mir!
Reactions: Schakara

Schakara

Moderator
Mitarbeiter
Dez 13, 2022
2.509
1.579
Ebenfalls schönes Wochenende, und nein, deine Dokumentation ist nicht "okey" sondern überragend 😄

Wäre jede Troubleshooting Dokumentation so, hätten wir nur noch 1/3 der Probleme. Ich bin gespannt auf Sonntag und hoffe auf ein positives Ergebnis.