staging.inyokaproject.org

unpaper

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |
Dieses Thema ist die Diskussion des Artikels unpaper.

Heinrich_Schwietering Team-Icon

Wikiteam
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Noch etwas aus dem Dunstkreis OCR/Scan-Bearbeitung: Baustelle/unpaper, klassisches Kommandozeilentool, mit unglaublich dezidierten Einstellungsmöglichkeiten. Bin noch am Tüfteln, und habe noch etwa Schwierigkeiten, Seiten aufzusplitten - der Ergebnisse lassen sich bei mir noch nicht in "vernünftigen" Blattgrößen ausgeben....

Vielleicht hat jemand Erfahrung mit dem Tool?

An der GUI-Geschichte (Baustelle/unpaper-GUI) muss ich noch basteln, hab's aber erstmal als eigenen Artikel ausgelagert, ist dann übersichtlicher.

Ansonsten: die übliche Bitte um Beachtung, Anmerkungen, Fragen, konstruktive Kritik etc.

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi! Heinrich Schwietering schrieb:

Ansonsten: die übliche Bitte um Beachtung, Anmerkungen, Fragen, konstruktive Kritik etc.

Ah ja... Bin ich wieder zu esoterisch in meiner Themenwahl für Artikel? Oder gibt es nichts anzumerken? 😉

so long
hank

noisefloor Team-Icon

Ehemaliger
Avatar von noisefloor

Anmeldungsdatum:
6. Juni 2006

Beiträge: 28316

Hallo,

im Artikel sind zwei Deadlinks, sonst sieht es ok aus.

Gruß, noisefloor

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Die Deadlinks waren z.T. Links auf (Noch-)Baustellen, hab' es gefixt und den Artikel verschoben: unpaper.

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Derzeit ungetestet; ich hoffe, ich komme demnächst dazu, es unter lucid/maverick zu testen.

so long
hank

Beforge Team-Icon

Ehemalige

Anmeldungsdatum:
29. März 2018

Beiträge: 2007

Wenn veraltet Links nur auskommentiert werden und nicht gelöscht, wäre es gut, den Grund der Auskommentierung neben den Link zu schreiben. Sonst kann das später keiner mehr zuordnen.

Lode_Runner

Avatar von Lode_Runner

Anmeldungsdatum:
22. Oktober 2016

Beiträge: Zähle...

Hallo,

Unpaper ist ja für OCR gemacht und ich dachte mir, es wäre doch schön wenn man am Ende vom Beispiel im Wiki-Artikel ein PDF mit eingebettetem Text hätte. Ich benutze dafür tesseract. Diese Lösung ist halt ein bisschen komplizierter als tiffcp / tiff2pdf, das hier benutzt wird. Was meint ihr, soll man das ergänzen?

Ich benutze da folgende Befehle:

1
2
3
4
# Alle tiff im Verzeichnis in einzelne PDFs mit eingebettetem Text umwandeln
for page in $(ls *.tiff); do ; tesseract -l deu $page `basename --suffix=".tiff" $page` pdf ; done
# Alle PDF-Dateien im Verzeichnis zu einer zusammenführen
pdfunite `ls *.pdf` document.pdf

Grüße loderunner

tuxifreund Team-Icon

Projektleitung

Anmeldungsdatum:
7. November 2020

Beiträge: 1151

Hallo,

Xenial ist aus dem Getestet-Block raus. Der Artikel ist somit ungetestet.

LG
tuxifreund

Antworten |