Hallo Ihr,
ich habe hier keine Frage, dachte nur ich teile meine Erfahrungen mit, welche ich die letzten Tage beim Update von 14.04 nach 16.04 gemacht habe.
Upgedatet habe ich, wie vorgesehen, über do-release-upgrade, ohne -d
Zwei Rechner wurden dem Prozess unterzogen, eine Fileserver und ein Server auf dem verschiedene Dienste laufen wie DHCP, Bind9, KVM, Firewall.
Auf dem Fileserver lief: zfs-onlinux, Samba, netatalk 3.1.8, und Apache/php für Monitoring Zwecke.
Vor dem Upgrade habe natürlich ein Backup gemacht und dann netatalk deinstalliert, weil ich die neuere Version anschließend installieren wollte. Auch habe ich den zfs pool exportiert und zfs deinstalliert, weil das native zfs zum Einsatz kommen soll:
1. alles stoppen was auf den ZFS pool Zugriff hat 2. exportieren von ZFS pool 3. apt-get remove ubuntu-zfs zfs-doc spl-dkms 4. apt-get autoremove 5. do-release-upgrade 6. apt install zfsutils-linux 7. netatalk kompilieren und installieren
auf beiden Rechnern hatte ich nach dem update mit ureadahead Probleme (syslog wurde vollgespamt). das konnte ich mit:
sudo ureadahead --force-trace --verbose / ctrl+c sudo ureadahead --dump sudo reboot
beheben.
Auch gab es einige verwaiste Paket nach dem Upgrade, das habe ich mit purge gelöst:
dpkg --get-selections | grep deinstall #alle deinstallierten Pakete auflisten lassen: apt purge $deinstall-liste # auf eigene Gefahr
Auf dem Fileserver war anschließen php nicht mehr da, das musste ich neu installieren.
Auf dem zweiten Server war etwas mehr los. Zuerst hat Squid3 gemeckert, dass es nicht nach /var/log/squid3/ schreiben kann. Dieser Ordner musste erst angelegt werden. Auch kann man /etc/squid3 löschen, weil die Config nun ein neuer Ordner hat: /etc/squid
Der Samba Client hat immer wieder Meldungen nach syslog geschrieben:
root: /etc/dhcp/dhclient-enter-hooks.d/samba returned non-zero exit status 1
Das kann man beheben, indem man die Datei editiert, ziemlich weit unten "|| true" anhängen:
[ -x /etc/init.d/smbd ] && /usr/sbin/invoke-rc.d smbd reload || true
tc (traffic shaping) hatte Fehler gebracht wegen schlechtem Quantum. Das Problem müsste vorher schon bestanden haben, aber ist mir nicht aufgefallen, jetzt tauchte es auf jedem Fall im syslog auf. Hier ist halt der richtige Faktor und Quantum Wert wichtig. Gerechnet wird in Byte, minrate / 1500 ist der factor und minrate / factor ist der Quantum.
Die KVM Guest hatten alle Warnungen im log, in der Art:
[...] warning: host doesn't support requested feature: CPUID.01H:ECX.monitor [bit 3] warning: host doesn't support requested feature: CPUID.01H:ECX.ds_cpl [bit 4] warning: host doesn't support requested feature: CPUID.01H:ECX.smx [bit 6] warning: host doesn't support requested feature: CPUID.01H:ECX.est [bit 7] warning: host doesn't support requested feature: CPUID.01H:ECX.tm2 [bit 8] warning: host doesn't support requested feature: CPUID.01H:ECX.xtpr [bit 14] warning: host doesn't support requested feature: CPUID.01H:ECX.pdcm [bit 15] warning: host doesn't support requested feature: CPUID.01H:ECX.osxsave [bit 27] main_channel_link: add main channel client main_channel_handle_parsed: net test: latency 49.917000 ms, bitrate 4197504 bps (4.003052 Mbps) LOW BANDWIDTH
Die CPU Features Fehler kann man beheben indem man die Guest xml bearbeitet:
virsh edit guest
Und:
<type arch='x86_64' machine='pc-i440fx-trusty'>hvm</type>
änder nach:
<type arch='x86_64' machine='pc-i440fx-wily'>hvm</type>
Keine Ahnung warum nach wily...
LOW BANDWIDTH behebt sich von selbst nach letztem Problem.
Nach dem Upgrade hatte ein Netzwerkinterface eine Macke. Bei Beanspruchung hat es sich aufgehängt:
Aug 3 09:50:58 router kernel: [39160.270331] e1000e 0000:00:19.0 eth1: Detected Hardware Unit Hang: Aug 3 09:50:58 router kernel: [39160.270331] TDH <9b> Aug 3 09:50:58 router kernel: [39160.270331] TDT <a0> Aug 3 09:50:58 router kernel: [39160.270331] next_to_use <a0> Aug 3 09:50:58 router kernel: [39160.270331] next_to_clean <98> Aug 3 09:50:58 router kernel: [39160.270331] buffer_info[next_to_clean]: Aug 3 09:50:58 router kernel: [39160.270331] time_stamp <100943844> Aug 3 09:50:58 router kernel: [39160.270331] next_to_watch <9b> Aug 3 09:50:58 router kernel: [39160.270331] jiffies <100943a0e> Aug 3 09:50:58 router kernel: [39160.270331] next_to_watch.status <0> Aug 3 09:50:58 router kernel: [39160.270331] MAC Status <80083> Aug 3 09:50:58 router kernel: [39160.270331] PHY Status <796d> Aug 3 09:50:58 router kernel: [39160.270331] PHY 1000BASE-T Status <3800> Aug 3 09:50:58 router kernel: [39160.270331] PHY Extended Status <3000> Aug 3 09:50:58 router kernel: [39160.270331] PCI Status <10> Aug 3 09:50:58 router kernel: [39160.902158] br0: port 1(eth1) entered forwarding state Aug 3 09:51:00 router kernel: [39162.270534] e1000e 0000:00:19.0 eth1: Detected Hardware Unit Hang: Aug 3 09:51:00 router kernel: [39162.270534] TDH <9b> Aug 3 09:51:00 router kernel: [39162.270534] TDT <a0> Aug 3 09:51:00 router kernel: [39162.270534] next_to_use <a0> Aug 3 09:51:00 router kernel: [39162.270534] next_to_clean <98> Aug 3 09:51:00 router kernel: [39162.270534] buffer_info[next_to_clean]: Aug 3 09:51:00 router kernel: [39162.270534] time_stamp <100943844> Aug 3 09:51:00 router kernel: [39162.270534] next_to_watch <9b> Aug 3 09:51:00 router kernel: [39162.270534] jiffies <100943c02> Aug 3 09:51:00 router kernel: [39162.270534] next_to_watch.status <0> Aug 3 09:51:00 router kernel: [39162.270534] MAC Status <80083> Aug 3 09:51:00 router kernel: [39162.270534] PHY Status <796d> Aug 3 09:51:00 router kernel: [39162.270534] PHY 1000BASE-T Status <3800> Aug 3 09:51:00 router kernel: [39162.270534] PHY Extended Status <3000> Aug 3 09:51:00 router kernel: [39162.270534] PCI Status <10> Aug 3 09:51:02 router kernel: [39164.270727] e1000e 0000:00:19.0 eth1: Detected Hardware Unit Hang: Aug 3 09:51:02 router kernel: [39164.270727] TDH <9b> Aug 3 09:51:02 router kernel: [39164.270727] TDT <a0> Aug 3 09:51:02 router kernel: [39164.270727] next_to_use <a0> Aug 3 09:51:02 router kernel: [39164.270727] next_to_clean <98> Aug 3 09:51:02 router kernel: [39164.270727] buffer_info[next_to_clean]: Aug 3 09:51:02 router kernel: [39164.270727] time_stamp <100943844> Aug 3 09:51:02 router kernel: [39164.270727] next_to_watch <9b> Aug 3 09:51:02 router kernel: [39164.270727] jiffies <100943df6> Aug 3 09:51:02 router kernel: [39164.270727] next_to_watch.status <0> Aug 3 09:51:02 router kernel: [39164.270727] MAC Status <80083> Aug 3 09:51:02 router kernel: [39164.270727] PHY Status <796d> Aug 3 09:51:02 router kernel: [39164.270727] PHY 1000BASE-T Status <3800> Aug 3 09:51:02 router kernel: [39164.270727] PHY Extended Status <3000> Aug 3 09:51:02 router kernel: [39164.270727] PCI Status <10> Aug 3 09:51:04 router kernel: [39166.270896] e1000e 0000:00:19.0 eth1: Detected Hardware Unit Hang: Aug 3 09:51:04 router kernel: [39166.270896] TDH <9b> Aug 3 09:51:04 router kernel: [39166.270896] TDT <a0> Aug 3 09:51:04 router kernel: [39166.270896] next_to_use <a0> Aug 3 09:51:04 router kernel: [39166.270896] next_to_clean <98> Aug 3 09:51:04 router kernel: [39166.270896] buffer_info[next_to_clean]: Aug 3 09:51:04 router kernel: [39166.270896] time_stamp <100943844> Aug 3 09:51:04 router kernel: [39166.270896] next_to_watch <9b> Aug 3 09:51:04 router kernel: [39166.270896] jiffies <100943fea> Aug 3 09:51:04 router kernel: [39166.270896] next_to_watch.status <0> Aug 3 09:51:04 router kernel: [39166.270896] MAC Status <80083> Aug 3 09:51:04 router kernel: [39166.270896] PHY Status <796d> Aug 3 09:51:04 router kernel: [39166.270896] PHY 1000BASE-T Status <3800> Aug 3 09:51:04 router kernel: [39166.270896] PHY Extended Status <3000> Aug 3 09:51:04 router kernel: [39166.270896] PCI Status <10> Aug 3 09:51:04 router kernel: [39166.278679] e1000e 0000:00:19.0 eth1: Reset adapter unexpectedly Aug 3 09:51:04 router kernel: [39166.279147] br0: port 1(eth1) entered disabled state Aug 3 09:51:07 router kernel: [39169.880740] e1000e: eth1 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None Aug 3 09:51:07 router kernel: [39169.880779] br0: port 1(eth1) entered forwarding state Aug 3 09:51:07 router kernel: [39169.880784] br0: port 1(eth1) entered forwarding state Aug 3 09:51:12 router kernel: [39174.887422] br0: port 1(eth1) entered forwarding state
Im Netz kursieren dazu vier Lösungen:
Treiber von Intel installieren > habe ich gemacht, half nicht
grub Booteintrag: pcie_aspm=off > ging bei mir auch nicht
Enhanced C1 (C1E) im Bios deaktivieren > habe ich nicht mehr versucht, weil es glaube ich auch mit Energiesparfunktion zusammenhängt.
"TCP segmentation offload" im Interface deaktivieren: ethtool -K eth1 gso off gro off tso off > das hat funktioniert
Punkt 4. kann man auch dauerhaft machen unter /etc/network/interfces:
post-up ethtool -K eth1 gso off gro off tso off
Jetzt scheint erst mal wieder alles zu laufen. Wenn weitere Probleme auftauchen werde ich hier editieren.
Wenn Ihr auch Erfahrungen gesammelt habt könnt ihr sie gerne hier auch posten, dann aber bitte mit Lösungsansatz.
Grüße
Jonathan
Moderiert von tomtomtom:
Aus dem Supportbereich entfernt, da kein Supportthema.