staging.inyokaproject.org

Sporadische Schreibfehler NVMe M2 SSD crucial P3 Plus 2TB - Neustart notwendig

Status: Gelöst | Ubuntu-Version: Ubuntu 23.04 (Lunar Lobster)
Antworten |

safexy

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Bekomme den Fehler zu ganz unterschiedlichen Zeitintervallen:

Mal zwei Tage ohne jeglichen Fehler, bis zu 3 mal den Fehler innerhalb einer Stunde. Auf der SSD sind Windows, Linux Betriebssystem, Linux Boot / Kernel-Patition, Linux User-Partition. Diese Einrichtung hatte ich auf dem Vorgänger auch, es war nur eine andere SSD ()

Bekomme den Fehler zu ganz unterschiedlichen Zeitintervallen:

systemd-journald: failed to write entry, ignoring: input/output error

(mehr siehe Foto)

Die NVMe M2 SSD Crucial P3 Plus 2TB ist ein Ersatz der ursprünglichen 512GB Samsung die verbaut war, welche ich aber nicht verwendet habe.

Mal zwei Tage ohne jeglichen Fehler, bis zu 3 mal den Fehler innerhalb einer Stunde. Auf der SSD sind Windows, Linux Betriebssystem, Linux Boot / Kernel-Patition, Linux User-Partition. Diese Einrichtung hatte ich auf dem Vorgänger auch, es war nur eine andere Hersteller der SSD und anderer Prozessor, Chipsatz etc.

systemd-journald: failed to write entry, ignoring: input/output error

Bios-Version vom Schenker XMG Core 15 (AE21) (ID: XCO15AE21) habe ich von Anfang an die neuste Version aufgespielt.

Für die SSD gibt es keinerlei Firmware-Update

Spannungsversorgung der SSD habe ich im Bios von „Auto“ auf „Enabled“ gestellt

Befehl:

sudo smartctl -a /dev/nvme0n1p5 

Ausgabe:

smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.2.0-32-generic] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       CT2000P3PSSD8
Serial Number:                      2249E68F544E
Firmware Version:                   P9CR40A
PCI Vendor/Subsystem ID:            0xc0a9
IEEE OUI Identifier:                0x00a075
Controller ID:                      1
NVMe Version:                       1.4
Number of Namespaces:               1
Namespace 1 Size/Capacity:          2.000.398.934.016 [2,00 TB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            6479a7 7020000074
Local Time is:                      Tue Sep 12 09:08:27 2023 CEST
Firmware Updates (0x12):            1 Slot, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005e):     Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Log Page Attributes (0x06):         Cmd_Eff_Lg Ext_Get_Lg
Maximum Data Transfer Size:         64 Pages
Warning  Comp. Temp. Threshold:     85 Celsius
Critical Comp. Temp. Threshold:     95 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W  0.0000W       -    0  0  0  0        0       0
 1 +     3.00W  0.0000W       -    0  0  0  0        0       0
 2 +     1.50W  0.0000W       -    0  0  0  0        0       0
 3 -   0.0250W  0.0000W       -    3  3  3  3     5000    1900
 4 -   0.0030W       -        -    4  4  4  4    13000  100000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         1
 1 -    4096       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        39 Celsius
Available Spare:                    100%
Available Spare Threshold:          5%
Percentage Used:                    0%
Data Units Read:                    606.033 [310 GB]
Data Units Written:                 3.046.266 [1,55 TB]
Host Read Commands:                 7.815.606
Host Write Commands:                24.907.507
Controller Busy Time:               33
Power Cycles:                       165
Power On Hours:                     485
Unsafe Shutdowns:                   63
Media and Data Integrity Errors:    0
Error Information Log Entries:      235
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               39 Celsius
Temperature Sensor 2:               49 Celsius
Temperature Sensor 8:               39 Celsius

Error Information (NVMe Log 0x01, 16 of 16 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0        235     0  0x0008  0x4005  0x028            0     0     -

Bin schon so einige Lösungen anderer im Netz durch, was aber alles keine Besserung gebracht hat.

Führe gerne ggf. diese neu durch.

Was mich wundert ist, dass der Fehler zu 80% auftritt, wenn ich das Notebook vom den Oberschenkeln zu mir ranhebe oder es anhebe und es neben mir abstelle. Mache ich die Bewegung aber bewusst und auch mehrfach hintereinander, tritt der Fehler nicht auf.

Error Information Log Entries steigt mit jedem mal an, inzwischen schon auf 235.

Angeschlossen ist das original Netzteil.

Macht es Sinn, denn SSD Slot zu wechseln?

Bilder

DJKUhpisse Team-Icon

Supporter, Wikiteam
Avatar von DJKUhpisse

Anmeldungsdatum:
18. Oktober 2016

Beiträge: 18245

systemd-journald: failed to write entry, ignoring: input/output error

Ist ganz schlecht. Schaue mal, ob die SSD richtig verbunden ist und ob die Kontakte sauber sind. Kannst du die in einem anderen System testen?

hakel2022

Anmeldungsdatum:
21. Februar 2022

Beiträge: 3254

Smart -herstellerspezifisch- hat einen G-Sensor. Wäre also möglich, daß der auf deine "Aktionen" reagiert.

Hast du schon den langen Smart gemacht? Alles andere ist sinnfrei ... ☹

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

"Ist ganz schlecht. Schaue mal, ob die SSD richtig verbunden ist und ob die Kontakte sauber sind. Kannst du die in einem anderen System testen?"

Das hatte ich vor drei Tagen gemacht.

Ausgebaut, geschaut ob die Kontakte sauber sind und mit mehr Anpressdruck zum Slot festgeschraubt. Da lief es auch zwei Tage ohne Fehler und ich freute mich schon. Ab dann kam der Fehler wieder und innerhalb der letzten 24 Stunden waren es 3 oder 4 mal.

Die SSD habe ich nagelneu, war versiegelt und habe auch nie auf die Kontakte gefasst, daher habe ich es auch nicht mit Alkohol gereinigt. Über LIVE-System habe ich die Daten von der alten SSD zur neuen kopiert (aber diesen Rechner mit den Problemen). Das waren 1 TB und da gab es keine Probleme, obwohl die im externen Gehäuse deutlich wärmer geworden ist. Das Live-System schreibt aber nicht auf den SSD-Slot. Weiß halt nicht, ob was mit dem Slot nicht in Ordnung ist, an der SSD, Kernel oder sonstwas ist.

Es gäbe noch einen zweiten Slot im Notebook, der noch unbenutzt ist.

Windows habe ich auch noch drauf, nutze das aber so gut wie gar nicht.

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

hakel2022 schrieb:

Smart -herstellerspezifisch- hat einen G-Sensor. Wäre also möglich, daß der auf deine "Aktionen" reagiert.

Hast du schon den langen Smart gemacht? Alles andere ist sinnfrei ... ☹

Wenn ich

sudo smartctl -t long /dev/nvme0n1p6

und direkt danach

sudo smartctl -c /dev/nvme0n1p6 | grep -A 1 "execution status"

ausführe, zeigt er mir nichts an. Partition ist 100GB groß oder hat er die in Sekunden durch, da es SSD ist?

Geht das mit dem aktuellen System was drauf läuft oder muss ich von Live-CD starten?

seahawk1986

Anmeldungsdatum:
27. Oktober 2006

Beiträge: 11278

Hat das Notebook Stürze oder sonstige unsanfte Behandlung hinter sich? Nicht dass z.B. das Mainboard einen kleinen Riss bekommen hat, der sich je nach Temperatur und Biegestress bemerkbar macht.

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Ist ein älteres Modell (Modelljahr), was ich aber vor ein paar Wochen als neu gekauft habe, in Originalverpackung inkl. Polsterung. Nachdem ich die prinzipielle Funktion per Live-CD einige Stunden getestet hatte (und ja die Daten von externer zu externe SSD übertragen hatte), habe ich RAM und SSD aufgerüstet und Linux neu installiert (bis auf die Datenpartition).

Bei mir ist nie mechanisch gestürzt.

Im Hintergrund läuft Tuxedo Control Center, was ich mir aber nicht vorstellen kann, dass das den Fehler verursacht.

Janna

Anmeldungsdatum:
1. Juni 2021

Beiträge: 68

safexy schrieb:

Die SSD habe ich nagelneu, war versiegelt

Na dann ist doch noch Gewährleistung drauf. Also zurück zum Händler.

Es kann allerdings auch ein Fehler auf dem Mainboard sein.
Dies hier

Was mich wundert ist, dass der Fehler zu 80% auftritt, wenn ich das Notebook vom den Oberschenkeln zu mir ranhebe oder es anhebe und es neben mir abstelle. Mache ich die Bewegung aber bewusst und auch mehrfach hintereinander, tritt der Fehler nicht auf.

spricht eher für einen Fehler auf dem Mainboard. Durch das Anheben kann es nicht nur zu Kontaktproblemen an schlechten Lötstellen kommen, sondern es können auch Ströme in den Leiterbahnen induziert werden, welche zu diesen Störungen führen.

Wie sieht es denn mit dem Garantiestatus des Motherboards oder Notebooks aus?

Hast du die leere 512GB-SSD noch oder eine andere SSD? Das wäre auch einen Versuch wert (unbedingt im gleichen SSD-Slot). Tritt der Fehler auch mit einer anderen SSD auf, dann liegt es nicht an der SSD, sondern am Motherboard. (Die Umkehrung gilt nicht unbedingt. Funktioniert es dann, heißt das nicht zwingend, dass deine 2TB SSD hin ist.)

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Aktuell läuft das Notebook mit der SSD ohne dass ich irgendetwas geändert habe schon 8 Stunden durch. Mehrfach das Notebook bewegt, auch umgedreht. Einige Texte und Mails geschrieben.

Bevor ich was reklamiere, sollte ich schon wissen, was die Ursache ist. Ob es an der nachgerüsteten SSD liegt oder am Notebook selbst. Die SSD die dabei war habe ich noch, die ist aber zu klein, damit ich damit arbeiten kann.

Könnte höchstens diese verwenden um Linux drauf zu kopieren und die Datenpartition über den 2. Slot anbinden. Da würde ich sehen, ob dann alle eingebundenen Partitionen von dem Fehler betroffen sind oder nur von einem Slot.

Muss nach dem Klonen dann nur die entsprechende "/etc/fstab" die entsprechenden Partitionsbezeichnungen anpassen. Irgendwas vergessen?

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Habe noch nicht umgebaut, wollte den nächsten Absturz abwarten. Jetzt nach ca. 12 Stunden war es wieder soweit. Habe zu meinem Sohn gesagt: "jetzt wenn ich es zur Seite lege, stürzt es ab" Und so war es auch. Habe noch überlegt, ob ich den Text vorher speichere, hätte ich das mal gemacht...

Was war der Unterschied zu der restlichen Zeit (12 Stunden). Ich hatte es ca. 15 Minuten zuvor für ca. 2 Minuten mal nicht am Netzteil gehabt (ist das originale).

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Habe mal die swap-datei nun über /etc/fstab dauerhaft entfernt. Hatte früher auch schon lange keine Swap-Partition. Mal schauen, ob der Fehler noch auftritt.

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Habe nun den Akku ein paar Minuten zu entladen und aufladen lassen und immer wieder das Notebook weggelegt. Fehler trat nicht auf.

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Habe hier noch einen Bericht gefunden, da geht es um eine Kingston SSD, Problem mit deep sleep

https://git.launchpad.net/~ubuntu-kernel/ubuntu/+source/linux/+git/focal/commit/?id=47add9f75714fabd3702dca0e5899a56d2f3ee2f

Könnte das Problem auch bei der Crucial bestehen?

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

safexy schrieb:

Habe mal die swap-datei nun über /etc/fstab dauerhaft entfernt. Hatte früher auch schon lange keine Swap-Partition. Mal schauen, ob der Fehler noch auftritt.

Aktuell mit der Maßnahme läuft das Notebook schon 23 Stunden ohne Fehler durch. Habe auch mal eine 10 GB Datei von einer Partition auf eine andere kopiert. Zig mal das Notebook auch zur Seite gestellt, so wie die Tage auch zuvor.

Werde weiter berichten...

safexy

(Themenstarter)

Anmeldungsdatum:
13. Oktober 2007

Beiträge: 81

Nach etwas weniger als 2 Tagen, trat der Fehler wieder auf.

Am Wochenende werde ich dann mal die OS Partitionen auf die vorherige 500GB SSD kopieren und schauen, ob dann auch der Fehler auftritt.

Antworten |