dbmtrde
Anmeldungsdatum: 3. Mai 2023
Beiträge: 2
|
Hallo zusammen, ich habe aufm Server versucht ein tgz Datei zu entpacken und dabei ist der Server eingefroren und konnte nichts mehr machen, bis ich die Kiste rebootet habe.
Ich konnte nichts aussagekräftiges finden in Journal und auch in Syslog, daher hier die Frage wie man bei solchen Situationen vorgehen sollte um die Fehler zu identifizieren, was da geschehen ist.
Server wurde erst gestern neu aufgesetzt bzw. zur Verfügung gestellt. Welche begriffe sollte man suchen in den Log Dateien oder werden überhaupt sachen geloggt die für solche Problemen führen können und ggf. wo werden diese gespeichert, wenn Journal und Syslog nicht die richtigen sind. OS Version
| lsb_release -a
LSB Version: core-11.1.0ubuntu4-noarch:security-11.1.0ubuntu4-noarch
Distributor ID: Ubuntu
Description: Ubuntu 22.04.2 LTS
Release: 22.04
Codename: jammy
|
Server (Dedicated)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33 | $lshw -short
H/W path Device Class Description
==============================================================
system MC13-LE0-000 (01)
/0 bus MC13-LE0-000
/0/0 memory 64KiB BIOS
/0/17 memory 768KiB L1 cache
/0/18 memory 12MiB L2 cache
/0/19 memory 64MiB L3 cache
/0/1a processor AMD Ryzen 9 7900X 12-Core Processor
/0/1c memory 64GiB System Memory
/0/1c/0 memory [empty]
/0/1c/1 memory 32GiB DIMM Synchronous Unbuffered (Unregistered) 4800 MHz (0,2 ns)
/0/1c/2 memory [empty]
/0/1c/3 memory 32GiB DIMM Synchronous Unbuffered (Unregistered) 4800 MHz (0,2 ns)
/0/100 bridge Advanced Micro Devices, Inc. [AMD]
/0/100/0.2 generic Advanced Micro Devices, Inc. [AMD]
/0/100/1.1 bridge Advanced Micro Devices, Inc. [AMD]
/0/100/1.1/0 /dev/nvme0 storage SAMSUNG MZ1L2960HCJR-00A07
/0/100/1.1/0/0 hwmon0 disk NVMe disk
/0/100/1.1/0/2 /dev/ng0n1 disk NVMe disk
/0/100/1.1/0/1 /dev/nvme0n1 disk 960GB NVMe disk
/0/100/1.1/0/1/1 /dev/nvme0n1p1 volume 1074MiB Windows FAT volume
/0/100/1.1/0/1/2 /dev/nvme0n1p2 volume 8191MiB Linux swap volume
/0/100/1.1/0/1/3 /dev/nvme0n1p3 volume 885GiB EFI partition
/0/100/1.3 bridge Advanced Micro Devices, Inc. [AMD]
/0/100/1.3/0 /dev/nvme1 storage SAMSUNG MZ1L2960HCJR-00A07
/0/100/1.3/0/0 hwmon1 disk NVMe disk
/0/100/1.3/0/2 /dev/ng1n1 disk NVMe disk
/0/100/1.3/0/1 /dev/nvme1n1 disk 960GB NVMe disk
/0/100/1.3/0/1/1 /dev/nvme1n1p1 volume 1074MiB Windows FAT volume
/0/100/1.3/0/1/2 /dev/nvme1n1p2 volume 8191MiB Linux swap volume
/0/100/1.3/0/1/3 /dev/nvme1n1p3 volume 885GiB EFI partition
|
Vielen Dank im Voraus!
VG
|
dingsbums
Anmeldungsdatum: 13. November 2010
Beiträge: 3337
|
|
dbmtrde
(Themenstarter)
Anmeldungsdatum: 3. Mai 2023
Beiträge: 2
|
dingsbums schrieb: Liest sich wie entweder
Tgz war ca 9 GB groß und zu wenig RAM kann glaube ich bei 64GB nicht sein, aber irgendetwas mit Hardware könnte schon sein. Es hat auch mal bei einem Reboot mal gehangen(?!) und müssten nochmal resetten dass die Kiste überhaupt wieder hochfährt.
Wie erwähnt wurde die Kiste uns gestern zur Verfügung gestellt und haben auch bemerkt, dass es auch beim Booten länger dauert als wie der Vorgänger bzw. auch bei anderen Server die wir haben. Bin etwas verloren auf der suche daher wollte hier fragen nach was und wo ich am besten suchen sollte. Anbei ein paar Fehler aus "journalctl -r -p err" 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46 |
Mai 04 01:09:59 node.server.tld kernel: snd_hda_intel 0000:0e:00.6: no codecs found!
Mai 04 01:09:59 node.server.tld kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)
Mai 04 01:09:59 node.server.tld kernel: ACPI Error: AE_ALREADY_EXISTS, During name lookup/catalog (20220331/psobject-220)
Mai 04 01:09:59 node.server.tld kernel: ACPI BIOS Error (bug): Failure creating named object [\_GPE._L02], AE_ALREADY_EXISTS (20220331/dswload2-326)
-- Boot 7525b5b1c7df4db9ae71eeeab151c433 --
Mai 03 22:54:22 node.server.tld kernel: snd_hda_intel 0000:0e:00.6: no codecs found!
Mai 03 22:54:22 node.server.tld kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)
Mai 03 22:54:22 node.server.tld kernel: ACPI Error: AE_ALREADY_EXISTS, During name lookup/catalog (20220331/psobject-220)
Mai 03 22:54:22 node.server.tld kernel: ACPI BIOS Error (bug): Failure creating named object [\_GPE._L02], AE_ALREADY_EXISTS (20220331/dswload2-326)
-- Boot e99549577e3844e3acf8dbdf69a55a34 --
Mai 03 19:37:44 node.server.tld sshd[7547]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 03 17:59:26 node.server.tld sshd[2004]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 03 17:28:48 node.server.tld kernel: snd_hda_intel 0000:0e:00.6: no codecs found!
Mai 03 17:28:47 node.server.tld kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)
Mai 03 17:28:47 node.server.tld kernel: ACPI Error: AE_ALREADY_EXISTS, During name lookup/catalog (20220331/psobject-220)
Mai 03 17:28:47 node.server.tld kernel: ACPI BIOS Error (bug): Failure creating named object [\_GPE._L02], AE_ALREADY_EXISTS (20220331/dswload2-326)
-- Boot 4458738583594833a39377d57ab7bb91 --
Mai 03 17:21:46 node.server.tld sshd[104498]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 03 17:20:14 node.server.tld kernel: psi: task underflow! cpu=5 t=2 tasks=[0 0 0 1 0] clear=c set=0
Mai 02 18:52:20 node.server.tld sshd[39607]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 02 16:58:49 node.server.tld sshd[37629]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 02 03:09:03 node.server.tld sshd[14194]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 02 02:37:37 node.server.tld sshd[11414]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 02 01:44:32 node.server.tld sshd[10313]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 01 22:45:15 node.server.tld sshd[2667]: pam_systemd(sshd:session): Failed to release session: Interrupted system call
Mai 01 21:01:37 node.server.tld kernel: snd_hda_intel 0000:0e:00.6: no codecs found!
Mai 01 21:01:37 node.server.tld kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)
Mai 01 21:01:37 node.server.tld kernel: ACPI Error: AE_ALREADY_EXISTS, During name lookup/catalog (20220331/psobject-220)
Mai 01 21:01:37 node.server.tld kernel: ACPI BIOS Error (bug): Failure creating named object [\_GPE._L02], AE_ALREADY_EXISTS (20220331/dswload2-326)
-- Boot 32962d8d601d4f1aa9ca9f8eb6e7f3e3 --
Mai 01 20:55:20 node.server.tld kernel: snd_hda_intel 0000:0e:00.6: no codecs found!
Mai 01 20:55:20 node.server.tld kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)
Mai 01 20:55:20 node.server.tld kernel: ACPI Error: AE_ALREADY_EXISTS, During name lookup/catalog (20220331/psobject-220)
Mai 01 20:55:20 node.server.tld kernel: ACPI BIOS Error (bug): Failure creating named object [\_GPE._L02], AE_ALREADY_EXISTS (20220331/dswload2-326)
-- Boot 74bf5f0b3f02405fbf69b717b51adae2 --
Mai 01 20:34:07 srv-xxx kernel: snd_hda_intel 0000:0e:00.6: no codecs found!
Mai 01 20:34:06 srv-xxx kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)
Mai 01 20:34:06 srv-xxx kernel: ACPI Error: AE_ALREADY_EXISTS, During name lookup/catalog (20220331/psobject-220)
Mai 01 20:34:06 srv-xxx kernel: ACPI BIOS Error (bug): Failure creating named object [\_GPE._L02], AE_ALREADY_EXISTS (20220331/dswload2-326)
-- Boot 06310fa8346844fa89d6540f6f9689e2 --
Mai 01 20:28:36 srv-xxx sshd[2123]: error: beginning MaxStartups throttling
Mai 01 20:28:36 srv-xxx sshd[29955]: error: kex_exchange_identification: Connection closed by remote host
Mai 01 20:27:12 srv-xxx sshd[15788]: error: kex_exchange_identification: Connection closed by remote host
Mai 01 20:27:12 srv-xxx sshd[2123]: error: beginning MaxStartups throttling
Mai 01 20:22:25 srv-xxx sshd[15674]: error: kex_exchange_identification: Connection closed by remote host
|
|