Hi!
@ passer-domesticus Habe leider deinen Post vom Anfang des Jahres verpasst; falls noch aktuell, hier ein paar Hinweise.
passer-domesticus schrieb:
Leider habe ich es nicht hinbekommen, mit den Beschreibungen dieses Artikels und des anderen von https://wiki.ubuntuusers.de/OCRmyPDF/ die OCR in xsane zu integrieren. Insbesondere bleibt mir scheleierhaft, wie man die Skripte xsane2sandwich.sh und xsane2OCRmyPDF.sh von xsane aus zugänglich macht. Ich sehe zwar ein grünes Symbol in der Taskleiste, zwischendurch entsteht auch eine *.tiff-Datei meiner Scans. Die pdf-Datei am Schluß ist aber nicht durchsuchbar.
Die Anweisungen für die Skripte werden in der XSane-Konfiguration zu zur Texterkennung gemacht: XSane → Reiter "Einstellungen" → Konfiguration → Texterkennung. Dort den Pfad zum verwendeten Skript angeben, und die gewünschten Option dahinter stellen. Achte darauf, dass keine doppelten Leerzeichen stehen! Liefert die Log-Datei (standardmäßig bin /tmp/xsaneOCRmyPDF.log) irgendwelche Anhaltspunkte?
Es wäre an der Zeit, aus beiden Artikeln einen zu machen
Möglich, aber nicht unbedingt nötig. OCRmyPDF ist zunächst mal eine Kommandozeilenanwendung, die ich im Skript dann für XSane nutzbar gemacht habe.
und einen dritten zu dem hier in der Diskussion angesprochenen Thema "Volltextsuche".
Das ist allerdings ein ganz anderes Thema...
Was ich gerne hätte:
Aus xsane beliebig viele Seiten nacheinander einscannen, ohne zuvor gezählt zu haben, wieviele Blätter es sind, dabei einmal für alle folgenden Blätter einstellen, welche Bereiche der Vorlage in den Scan gehen sollen (notfalls zwischendurch noch mal durch den Vorschauscan gehen, so daß die geänderten Einstellungen dann für alle dann folgenden Seiten gelten),
das Ergebnis in eine durchsuchbare PDF-Datei speichern
und am liebsten nachher noch einen Durchlauf, in dem mir die Stellen in den Bilddateien gezeigt werden, an denen die OCR-Erkennung schlecht ging, um das Erkennungesergebnis manuell korrigieren zu können.
Leider momentan wohl nicht alles gleichzeitig möglich. Du könntest zunächst mit XSane ohne die xsane2xxx-Skripte eine mehrseitige PDF-Datei erstellen (da kannst du auch alle Seiten vorm Abspeichern noch mal ansehen, und ggf. die Reihenfolge ändern), und die dann mit OCRmyPDF mit Textlagen versehen (ginge auch mit dem Skript in XSANE, wenn du die letzte Seite damit anhängst).
Textkorrekturen an PDFs mit OCR sind unter Linux nur sehr aufwändig möglich; in gscan2pdf geht das zwar, allerdings eben nur sehr mühsam.
In der Windows-Welt können das verschiedene Programme, nach meiner Erfahrung recht gut Abbyy Fine Reader. Dummerweise habe ich es nicht hinbekommen, die Version 9.0 davon, die ich habe, mit Wine unter Linux ans Laufen zu bekommen. Es wäre natürlich schöner, mit freier Software eine anständige OCR-Erkennung von PDF-Dateien hinzubekommen, damit man deren Inhalte mit Volltextsuche findet.
Unter Linux kenne ich keine Open-Source-Software, die das alles so hinbekommt. Scan-Programme unter Wine kannst du so weit ich weiß nicht einsetzen, da klappt der Zugriff auf den Scanner nicht. Es gibt "ABBYY CLI OCR for Linux" (http://www.ocr4linux.com/en:start) 🇬🇧, allerdings IMHO recht teuer, was das vielleicht kann.
Ansonsten (Stichwort Volltextsuche) gibt es Paperwork, ich weiß allerdings nicht, ob daraus inzwischen direkt PDF-Dateien erstellt werden können; in der Diskussion war es zumindest.
so long
hank