staging.inyokaproject.org

ocrmypdf und ghostscript, Dateien werden zu groß

Status: Ungelöst | Ubuntu-Version: Ubuntu 20.04 (Focal Fossa)
Antworten |

Stefenzo

Anmeldungsdatum:
15. Februar 2009

Beiträge: 85

Hallo Zusammen,

gibt es für Linux etwas besseres als GhostScript um PDFs zu schrumpfen?

Der Hintergrund

ich möchte mit ocrmypdf Texterkennung in meinen PDFs durchführen.

1
ocrmypdf -d -c -i -l deu --output-type pdfa ./Scan_Mono_003881.pdf ./temp.pdf

was mich ärgert, die Datei ist danach ca. 1,5 mal so groß als vorher. 300 Kbyte danach 450 kbyte. Weglassen von -c und -i bringt keine Besserung. -d muss sein, sie soll geradegerichtet sein. Beim Einzugsscan sind die Dokumente oft etwas schräg.

also mit GhostScript Schrumpfen

1
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dBATCH -sOutputFile=./temp2.pdf ./temp.pdf

...jetzt hat die Datei 600 kbyte.

Das ist nicht mit allen Dateien gleich. Manche werden auch fast wieder so Groß als zuvor. Aber die Qualität und Gleichzeitig die Dateigröße, wie sie aus meinem Brother Gerät kommt, erreiche ich nicht mehr. mit /screen in GhostScript, kann ich mit der Datei fast nichts mehr anfangen.

wie kann ich das besser machen?

Grüße

Stefenzo

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1201

Stefenzo

(Themenstarter)

Anmeldungsdatum:
15. Februar 2009

Beiträge: 85

Hallo nochmal,

ich habe jetzt einiges Probiert, da mir vor allem aufgefallen ist, dass die PDFs nach dem bearbeiten mit GhostScript nicht mehr PDF/a konform waren. Alleine der Versuch das mit GhostScript zu lösen, ist ein ding der Unmöglichkeit. es reicht nicht, gs einen Parameter zu übergeben dass es eine PDF/a erstellen soll, nein mann muss diverese Parameter setzten und noch eine Vorlage Date bearbeiten in der man ein ICC Profil übergeben muss.

Ich habe das mit diversen Anleitungen versucht, eine direkt auf ghostscript.com, nichts hat funktioniert. Das mit der Dateigröße war auch nicht in den Griff zu bekommen.

Ich habe mir dann ocrmypdf nochmal genauer angesehen. Da gibt es auch einen Parameter für die Qualität, hatte ich vorher noch nicht entdeckt. für PDF/a reicht auch ein Schalter dann passt das. und wenn ich hier weiter Komprimiere bekomme ich ähnlich große Dateien als von meinem Scanner und in ausreichender Qualität. (Vergleichbar mit dem Original)

Ich kann gs nicht verstehen, es ist ja toll, wenn so ein Werkzeug viele Möglichkeiten bietet. Aber muss das wirklich derart kompliziert sein? Offensichtlich geht da ohne umfangreiche Schulung nichts...

sh4711 danke für den Tipp, das klappt jetzt aber mit ocrmypdf.

Gruß Stefenzo

Antworten |