staging.inyokaproject.org

Ganze (fremde) Website downloaden? (alternative zu HTTrack)

Status: Ungelöst | Ubuntu-Version: Ubuntu 22.04 (Jammy Jellyfish)
Antworten |

Reihner

Anmeldungsdatum:
14. Juni 2017

Beiträge: 143

Hi, kennt jemand eine gute, optimalerweise bessere, Alternative zu HTTrack?

HTTrack bricht bei mir mittendrin ab, lädt die Seite nicht vollständig, crawlt auch von ganz andern Seiten oder weigert sich den Prozess zu starten.

Vor vielen Jahren gab es da noch ein anderes Programm, ich glaube es hieß Ineta, aber das finde ich nicht mehr.

Im Grunde will ich nur eine ganze Website offline verfügbar machen. Mit sämtlichen Daten auf der selben Website sie von der Hauptseite aus erreichbar sind, z.B. über Verlinkung oder Einbettung.

Alternativ suche ich noch eine Methode um von archive.org ähnliches zu tun. Also einfach sagen: "lade mir alles was du zu Website XYZ gespeichert hast runter". das ersetzt aber nicht das Programm an sich.

ChickenLipsRfun2eat Team-Icon

Supporter
Avatar von ChickenLipsRfun2eat

Anmeldungsdatum:
6. Dezember 2009

Beiträge: 12070

Um welche Seite geht es denn? Theoretisch geht das auch einfach mit wget (--recursive, --no-parent, etc., Tiefe beachten!)

schollsky

Avatar von schollsky

Anmeldungsdatum:
3. Dezember 2012

Beiträge: 1338

Hallo Reihner,

unabhängig von HTTRack, wget, curl oder sonst einer entsprechenden Software: das wird wohl nur mit Webseiten funktionieren, die kein Javascript enthalten - und das werden erfahrungsgemäß immer weniger.

Bevor Du Dir ggf. unnötige Frustrationserfahrungen holst, solltest Du also die gewünschte Zielseite auf Plain HTML prüfen.

Grüße

schollsky

umbhaki Team-Icon

Supporter
Avatar von umbhaki

Anmeldungsdatum:
30. Mai 2010

Beiträge: 2458

ChickenLipsRfun2eat schrieb:

Theoretisch geht das auch einfach mit wget (--recursive, --no-parent, etc., Tiefe beachten!)

Es gab da mal ein Skript namens Tkwget, das hat eine grafische Oberfläche für wget bereitgestellt (siehe Anhang). Installiert muss sein:

  • Tcl/Tk 8.0 or later

  • GNU Wget 1.5.3 or later

So steht es in der README. Beides ist im Repo und schnell nachinstalliert, falls nicht sowieso schon vorhanden. Bei mir mit Xubuntu Jammy funktioniert das wie eh und je. Nur finde ich das Skript jetzt nicht mehr in diesem Internet. ☹

Kann man hier auch ein tar.gz-Archiv anhängen? Dann könnte ich meine Version (sogar ins Deutsche übersetzt) zur Verfügung stellen. Ist offen.

Bilder

ChickenLipsRfun2eat Team-Icon

Supporter
Avatar von ChickenLipsRfun2eat

Anmeldungsdatum:
6. Dezember 2009

Beiträge: 12070

umbhaki schrieb:

Kann man hier auch ein tar.gz-Archiv anhängen?

Nein. Zumindest aktuell nicht. Du kannst es aber auf bspw. https://codeberg.org hosten und pflegen.

Reihner

(Themenstarter)

Anmeldungsdatum:
14. Juni 2017

Beiträge: 143

ChickenLipsRfun2eat schrieb:

Um welche Seite geht es denn?

Da möchte ich nicht ins Detail gehen. Als Beispiel aber pcgh.de-Forum abspeichern. Mit allem Drum und Dran was ohne Anmeldung zu erreichen ist.

schollsky schrieb:

das wird wohl nur mit Webseiten funktionieren, die kein Javascript enthalten ... auf Plain HTML prüfen.

Da die Seite ja mit HTTrack ja teilweise funktioniert(e) gehe ich mal davon aus das. Es gibt/gab auch keine Anmeldung auf der Webseite. Scheint so als wäre die Seite unlängst au dem Netz geflogen bzw. auf eine andere Domain umgezogen. DAher mein Nachtrag "einfach" das Seitenabbild von archiv.org zu ziehen .. wenn ich nur wüsste wie.

Irgendwie klappt das nicht so recht mit wget. Wget lädt nicht die Bilder von anderen Domains, die auf der Seite mit eingebunden sind.

umbhaki schrieb:

Es gab da mal ein Skript namens Tkwget, das hat eine grafische Oberfläche für wget bereitgestellt (siehe Anhang).

Wie bekomme ich das GUI hin? Es ist Tcl 8.6.11+1, wget 1.13

umbhaki Team-Icon

Supporter
Avatar von umbhaki

Anmeldungsdatum:
30. Mai 2010

Beiträge: 2458

Reihner schrieb:

Wie bekomme ich das GUI hin? Es ist Tcl 8.6.11+1, wget 1.13

Aalso, der Vorschlag von ChickenLipsRfun2eat, das Ding zu hosten und zu pflegen, übersteigt meine Kompetenzen – ich bin simpler Nutzer ohne Skript- oder gar Programmierkenntnisse. Ich habe im Original-Skript seinerzeit lediglich ein paar englische Wörter durch deutsche ersetzt. Deshalb mache ich dir (und eventuell mitlesenden Interessenten) einfach dieses Open-Source-Skript über meine Telekom-Wolke zugänglich.

Wenn du hier drauf klickst: Klick, solltest du den Download der Tkwget.tar.gz angeboten bekommen. Lade das herunter und entpacke das Archiv, es enthält einen Ordner namens Tkwget mit vier Dateien darin. Speichere dir den Ordner an einen geeigneten Ort und lies erstmal die README darin, denn du musst noch was tun:

In deinem Ordner /usr/bin gibt es eine Datei namens wish8.6, Tkwget sucht aber nach wish ohne Versionsziffer. Also musst du entweder eine Zeile im Skript ändern oder von wish8.6 einen Softlink mit Namen wish anlegen. Steht in der README unter der Ziffer 3. INSTALLATION, wobei der in deutscher Sprache eingefügte Absatz meine persönliche Lieblingslösung enthält.

Dann sollte das Skript per Doppelklick starten (es sollte bereits ausführbar sein). Wenn du auch noch eine .desktop-Datei brauchst und nicht Bescheid weißt, dann melde dich einfach noch mal.

Antworten |