staging.inyokaproject.org

Archiv/Tutorial zur Konvertierung von .pdf zu .cbt

Status: Gelöst | Ubuntu-Version: Ubuntu
Antworten |
Dieses Thema ist die Diskussion des Artikels Archiv/pdf_zu_cbt.

human

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

Hallo Leute,

ich habe eine Idee für einen Wiki-Artikel. Ich würde aber gern, bevor ich anfange den zu schreiben, in die Runde fragen, ob es überhaupt Sinn ergibt, den zu verfassen.

Ich würde eine Art Tutorial schrieben, wie man verlustfrei (viele) .pdfs zum ComicBookFormat (.cbr, .cbt etc.) unter Linux konvertiert. Das ist recht simpel, wenn man die notwendigen Schritte erstmal kennt. Steht man allerdings vor dem Problem das erste Mal, muss man sich alles langwierig zusammensuchen. Darum würde ich das an dieser Stelle zusammenstellen wollen.

Gibt es dafür überhaupt Interesse auf ubuntuusers?

Xell

Avatar von Xell

Anmeldungsdatum:
17. Oktober 2005

Beiträge: 360

Das Internet vergisst nicht und Uu hat genügend Speicher - selbst wenn in 2 Jahren jemand nach dem Problem googelt und den Artikel findet hast du zumindest einem Menschen geholfen 😉

Eventuell lässt sich der Text auch in einen schon vorhandenen Artikel einbauen?

march Team-Icon

Avatar von march

Anmeldungsdatum:
12. Juni 2005

Beiträge: 17368

Gibt es dafür überhaupt Interesse auf ubuntuusers?

Zumindest bei mir. 😉

Ich verwende hier den Befehl convert TITEL.pdf TITEL.jpg und packe die Bilder anschließend als cbz. Die Qualität der Bilder entspricht nur leider nicht dem Original und ist viel schlechter. Wie man das ändern kann habe ich noch nicht recherchiert...

human

(Themenstarter)

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

So, ich hab jetzt eine erste vorläufige Vorlage schnell zusammengeschustert: Baustelle/pdf zu cbt

Änderungsvorschläge, Kritik usw. erwünscht. Ich hab zum Beispiel noch keinen griffigen Titel gefunden. Sollte das Tutorial veröffentlicht werden, könnte man an dieser Stelle einen Verweis machen: PDF.

Ich werde morgen noch was dran machen. ☺

mrkramps Team-Icon

Avatar von mrkramps

Anmeldungsdatum:
10. Oktober 2006

Beiträge: 5523

Statt dem Paket xpdf-utils sollte eigentlich das Paket poppler-utils installiert werden. Utilities sind die gleichen und seit 11.04 ist xpdf-utils nur noch als Übergangspaket in den Quellen, weil es von poppler-utils vollständig ersetzt wird. In vorherigen Ubuntu-Versionen kommt es bei der Installtion beider Pakete zu einem Konflikt, weil die Binaries in beiden Paketen die gleichen Namen haben und sich gemäß den Abhängigkeiten gegenseitig ersetzen.

Langer Rede kurzer Sinn, ersetze xpdf-utils in dem Artikel durch das neuere poppler-utils.

human

(Themenstarter)

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

Okay, Artikel entsprechend angepasst und weiter sprachlich verbessert.

Weitere Hinweise, Ergänzungen?

Noch ein Vorschlag: Man könnte hier Comix (Abschnitt „Eigene-Archive-erstellen“) entweder, das Abschnitt in meinen Artikel rüberkopieren oder aber meinen Artikel unten als Link mit aufführen.

Ich habe übrigens die Hinweisbox aus dem besagten Artikel kopiert. Ist das erlaubt?

noisefloor Team-Icon

Anmeldungsdatum:
6. Juni 2006

Beiträge: 29567

Hallo,

ein paar Sachen:

  • der Artikel ist nicht syntax-konform, insbesonders nicht Beschreibung der Paketinstallation

  • "Hintergrund ist der, dass das Lesen von elektronisch gespeicherten Texten unter Umständen mit Comic-Book-Readern, wie Comix, bequemer sein kann als mit einfachen PDF-Readern, wie Evince." → Weil? Also warum kann ein Comicreader bequemer als ein PDF-Reader sein?

  • zu Poppler-Utils gibt es einen Wikiartikel - bitte verlinken

  • welcher Alternativen gibt es zu Peazip, z.B. man ein Programm aus den Quellen verwenden möchte, weil man keine Software "von außerhalb" installieren möchte?

  • Der Abschnitt "Umbenennung"ist IMHO zu speziell. Umbenennen geht auch anders, dazu muss man nicht gprename nehmen... Also bitte allgemeiner Schreiben und auch die vorhandenen Artikel zu mv, pyRenamer und Krename verlinken.

Gruß, noisefloor

human

(Themenstarter)

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

  • der Artikel ist nicht syntax-konform, insbesonders nicht Beschreibung der Paketinstallation

Ih weiß nicht genau, was ich unter syntax-konform verstehen soll, aber ich habe im direkten Vergleich mit anderen Artikeln einige Anpassungen unternommen. Vielleicht meintest du das? Wenn ja, ist es ausreichend, was ich gemacht habe?

  • "Hintergrund ist der, dass das Lesen von elektronisch gespeicherten Texten unter Umständen mit Comic-Book-Readern, wie Comix, bequemer sein kann als mit einfachen PDF-Readern, wie Evince." → Weil? Also warum kann ein Comicreader bequemer als ein PDF-Reader sein?

Naja, das bleibt wohl subjektiv. Hab jetzt aber einige Vorzüge aufgeschrieben.

Gemacht!

  • welcher Alternativen gibt es zu Peazip, z.B. man ein Programm aus den Quellen verwenden möchte, weil man keine Software "von außerhalb" installieren möchte?

Ehrlich gesagt, weiß ich das nicht. Möglicherweise gibt es ein Konsolenprogramm in den Paketquellen, das das beherrscht. Ich bin da nicht so drin, eher ein Anfänger. Ich habe damals Peazip gefunden und gleich verwendet. Wenn jemand, das ergänzen kann, wäre es toll.

  • Der Abschnitt "Umbenennung"ist IMHO zu speziell. Umbenennen geht auch anders, dazu muss man nicht gprename nehmen... Also bitte allgemeiner Schreiben und auch die vorhandenen Artikel zu mv, pyRenamer und Krename verlinken.

Hab's verallgemeinert. Wobei jetzt gprename nicht mehr vorkommt, naja.

noisefloor Team-Icon

Anmeldungsdatum:
6. Juni 2006

Beiträge: 29567

Hallo,

schon besser. ☺

Habe noch ein paar kleine Korrekturen gemacht. Primär die Wikipedia-Links durch Interwiki-Links ersetzt.

Was ich gerade gesehen habe: wir haben schon einen Artikel zu Peazip. Den kannst du in diesem Artikel verlinken und deinen Teil entsprechend kürzen, um Redundanzen zu vermeiden.

Gruß, noisefloor

human

(Themenstarter)

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

Hab's gemacht. Ich habe ganz unten eine interne Verlinkung von Peazip gemacht, weil ich im Text bereits eine Verlinkung hatte.

Weiteres oder gut so? ☺

Was mir eigentlich noch fehlt ist ein besserer Titel, jemand eine Idee?

@ march

Hat dir der Artikel eigentlich geholfen?

noisefloor Team-Icon

Anmeldungsdatum:
6. Juni 2006

Beiträge: 29567

Hallo,

IMHO ist es ok so.

Gruß, noisefloor

cornix Team-Icon

Avatar von cornix

Anmeldungsdatum:
9. März 2007

Beiträge: 4763

Moin Moin

Fragen

  • Extrahiert werden mit dieser Methode nur Bilder aus den PDFs?

  • Im Prinzip ist es nur für Comics geeignet und für Text-PDFs nicht?

  • Hat jemand eine Beispieldatei? Vorzugsweise etwas mit CC-Lizenz.

Hinweise

  • for ist ungünstig, wenn Leerzeichen in den Dateinamen vorkommen

  • Umbenennen entfällt, gibt man beim Packen direkt die richtige Dateiendung an

march schrieb:

Ich verwende hier den Befehl convert TITEL.pdf TITEL.jpg

Konvertierung nach jpg ist verlustbehaftet, verwende stattdessen unkomprimiertes png: convert in.pdf -compress none out.png

Gruß, cornix

human

(Themenstarter)

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

Fragen

  • Extrahiert werden mit dieser Methode nur Bilder aus den PDFs?

Ne, da hab ich mich wohl falsch ausgedrückt. Die Seiten der PDF werden in Bilder exportiert, bspw. jpg, png usw.

  • Im Prinzip ist es nur für Comics geeignet und für Text-PDFs nicht?

Ist also auch für Texte geeignet.

  • Hat jemand eine Beispieldatei? Vorzugsweise etwas mit CC-Lizenz.

Wäre Ubunchu ein geeignetes Beispiel?

Hinweise

  • for ist ungünstig, wenn Leerzeichen in den Dateinamen vorkommen

Welche Alternative gibt es?

  • Umbenennen entfällt, gibt man beim Packen direkt die richtige Dateiendung an

Mh, da ich für diesen Teilschritt Peazip mit der grafischen Oberfläche genutzt habe, gab es diese Möglichkeit nicht, daher der beschriebene Umweg. Ich hab allerdings gesehen, dass man auch benutzerdefiniert packen kann, allerdings kenne ich die Befehle nicht, um dieses Szenario zu beschrieben. Müsste man gegebenenfalls ergänzen.

Ich verwende hier den Befehl convert TITEL.pdf TITEL.jpg

Die Möglichkeit kannte ich bereits

die convert in.pdf -compress none out.png allerdings nicht.

D.h., wenn man in meinem Befehl umschreibt, dahingehend, dass er keine Probleme mit Leerzeichen hat und in das verlustlose Format .png konvertiert, und wenn ich jemand die Möglichkeit kennt direkt ins CBT-Format zu packen, dann würde die ganze Sache erheblich erleichtert. ☺

Danke vielmals für die Anregung!

mrkramps Team-Icon

Avatar von mrkramps

Anmeldungsdatum:
10. Oktober 2006

Beiträge: 5523

human schrieb:

Fragen

  • Extrahiert werden mit dieser Methode nur Bilder aus den PDFs?

Ne, da hab ich mich wohl falsch ausgedrückt. Die Seiten der PDF werden in Bilder exportiert, bspw. jpg, png usw.

Mit pdfimages -j sicherlich nicht. Das extrahiert tatsächlich nur die eingebetteten Rastergrafiken aus einer PDF. Bei Comics mag das Sinn machen, bei Text/Pfaden natürlich nicht, wenn man ganze Seite aus einer PDF in Rastergrafieken konvertieren möchte. Dafür nimmt man dann z.B. ImageMagick oder das Programm pdftoppm aus den poppler-utils.

human

(Themenstarter)

Anmeldungsdatum:
15. Juni 2009

Beiträge: 244

Mit pdfimages -j sicherlich nicht. Das extrahiert tatsächlich nur die eingebetteten Rastergrafiken aus einer PDF. Bei Comics mag das Sinn machen, bei Text/Pfaden natürlich nicht, wenn man ganze Seite aus einer PDF in Rastergrafieken konvertieren möchte. Dafür nimmt man dann z.B. ImageMagick oder das Programm pdftoppm aus den poppler-utils.

Was man alles lernen kann. Nun gut, dann gibt es ja wohl zwei Möglichkeiten.

1. Entweder "Comic-PDF" zu CBT (bspw.) → mittels pdfimages -j + verbessertes Skript, damit unkomprimierte PNG dabei herauskommen.

2. Man nutzt ImageMagick um "Comic-PDF" und "Text-PDF" zu konvertieren + verbessertes Skript, damit unkomprimierte PNG dabei herauskommen.

Antworten |