Ich möchte ältere Dokumente in durchsuchbare pdfs umwandeln.
Dazu scanne ich mit einem Avision AV8350 und XSANE 0.999 zwecks Abspeichern in tiff-Format. Anschließend überarbeite ich mit Gimp und speichere dort die tiff-Dateien mit der Kompression CCITT-Gruppe-4-Fax.
(vgl. den interessanten Beitrag:
https://www.dietmarjanowski.de/wordpress/?p=16627 )
Nun lasse ich in GScan2pdf die Texterkennung über tiff-Dateien laufen, um dort anschließend die Textlage zu überprüfen und ggf. zu korrigieren.
Dabei kommt es vor, dass sich Gscan2pdf nach Drücken des Speichern-Buttons nicht mehr rührt, und zwar sowohl in der Einstellung Speichern nach pdf, als auch in der Einstellung Speichern nach DjVu.
Kann das mit der Kompression in Zusammenhang stehen? Ich dachte, CCITT-Gruppe-4 ist gerade "angesagt".
Insgesamt arbeitet das Programm auch sehr lahm.
Kubuntu 18.04
gscan2pdf 2.1.0
GIMP 2.8.22
XSANE 0.999