Ein neues Kapitel, beim Versuch einen vernünftigen SW-Scan zu erhalten. Der Standardoptionendialog besteht aus fast nichts, siehe die Anlage hier und lässt sich auch nicht vergrößern. Der Dialog "erweiterte Optionen" scheint zwar schon etwas zu bewirken, aber man hat dann die Wahl zwischen verschiedenen Versionen von schlecht, siehe die Anlage. Mal noch mehr schwarzer Müll, wo Leerraum sein soll und mal noch ausgehöhltere und zerfallende Buchstaben. Ich finde keine Einstellung, die simultan beides vermeidet.
Mit meinem alten Scanner habe ich einfach die Helligkeit im Standarddialog so gewählt, dass alles Weiße weiß und die Schrift schwarz war. Das ging auch, wenn das Weiß etwa grau-gruen oder grau-braunes Recycling Papier war. Es ging sogar mit derselben Einstellung wie für blütenweißes Papier, wenn man die Helligkeit 42 wählte. Ja, wirklich, 42 war das universelle Optimum. Man konnte die Helligkeit aber über einen weiten Bereich wählen und bei nur ganz heller Einstellung wurden die Buchstaben zu dünn und bei sehr dunkler begannen sie zu verschmelzen und der Hintergrund fleckig zu werden. Selbst dann sah es aber nicht so katastrophal wie jetzt aus. Es waren dann eben schwarze Flächen, die nur am Rand ausgefranst sind.
Mit diesem Pixelmüll, den ich jetzt bekomme, tut sich tesseract-ocr so schwer, dass ich es gleich abtippen könnte und die Dateigröße ist meistens so beim etwa drei bis siebenfachen, bei derselben Auflösungsstufe, weil png den Unfug natürlich brav originalgetreu abspeichert.
Die Optionen
Helligkeit
Kontrast
Schwellwert
Schwellwertkurve
im erweiterte Optionendialog scheinen alle irgendwie einen Einfluss zu haben, aber ich finde trotz zahlreicher Testscans keine vernünftigen Einstellungen. Früher war die optimale Helligkeitseinstellung eine eindimensionale Aufgabe, jetzt ist es ein vierdimensionaler Raum.