staging.inyokaproject.org

xsane2djvu

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |
Dieses Thema ist die Diskussion des Artikels xsane2djvu.

Heinrich_Schwietering Team-Icon

Wikiteam
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Bei der Suche nach einer Segmentierungsmöglichkeit zum Selbsterstellen von DjVu-Dateien bin ich, als ich das xsane2djvu.sh-Skript basteln wollte, auf didjvu gestossen! Damit ist eine einigermaßen zuverlässige Segmentierung auch ohne DjVu-Original-Verfahren möglich, und mit xsane2djvu (natürlich aus xsane2tess abgekupfert 😉 ), kann man gleich aus XSane heraus arbeiten.

Die Dokumentation zu didjvu ist leider nicht-existent; ich werde den Autor mal anschreiben, ob ggf. noch Optionen zur Verbesserung der Segmentierung verwendbar sind, die ließen sich relativ problemlos in das Skript integrieren.

Der Artikel ist soweit fertig, die Zusammenfassung der Dateien mit djvm hab' ich noch nicht genauer angeschaut, da könnte man ggf. auch noch ein kleines Skript für basteln (Freiwillige vor!! 😇 ). Vielleicht könnte jemand python-kundiges auch noch das Installationsverfahren überprüfen? Ich weiß nicht genau, ob das so "lege artis" ist...

Wie üblich freue ich mich über Rückmeldungen aller Art, vielleicht kann jemand das Skript noch mal austesten?

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Kleiner Nachtrag: didjvu --help liefert die möglichen Optionen für das Programm didjvu, allerdings ohne jede Erläuterung; auch der Autor war nicht so sonderlich kooperativ ; hat abe immeghin versprochen, bei Weiterentwicklung auch eine Dokumentation dazu zu liefern... Einiges zu den Optionenkann man ggf. bei DjVuLibre-Programmen abschauen.

Für das Skript habe ich noch die Möglichkeit eingebaut, ocrodjvu-Optionen zu verwenden; sinnvoll sind allerdings nur die zur Textausgabe-Beeinflussung.

Die ausbleibenden Reaktionen werte ich als Zustimmung? Oder eher komplettes Desinteresse, sprich: vollständiger Irrelevanz des Artikels?...

so long
hank

march Team-Icon

Avatar von march

Anmeldungsdatum:
12. Juni 2005

Beiträge: 17329

komplettes Desinteresse

Ich würde sagen Überflutung mit Artikeln desselben Bereichs. 😉 Syntaxmäßig noch die Baustellenlinks entfernen und den Wissensblock um Root-Rechte erweitern, da diese im Artikel benötigt werden.

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Root-Rechte sind für's Installieren nötig, OK. Allerdings hatten wir irgendwo schon mal diskutiert, dass die benötigten Root-Rechte sowohl im Artikel Editor als auch Terminal beschrieben werden, und insofern für diese Fälle der Verweis entbehrlich wäre (war in irgendeiner Artikeldiskussion, weiß leider nicht mehr genau, bei welcher...). Aber ich kann es noch einbauen. Die Baustellen-Links beziehen sich auf eine weitere Baustellen zum Thema (jaja, Überflutung, ich weiß; bin eben manchmal "übergründlich" 😇 ), zu Baustelle/ocrodjvu, das müsste dann "zeitgleich" verschoben werden.

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Parallel zu ocrodjvu ins Wiki geschoben: xsane2djvu 😉

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Hab das Skript noch weiter verfeinert, es kann jetzt auch gleich mehrseitige DjVu-Dateien erstellen, und auch andere Encoder verwenden 🤓.

Ich hoffe, es wird deutlich, wie die Optionen verwendet werden müssen - testet das mal jemand?

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Und noch weiter gebastelt - Option zum Unterdrücken der Texterkennung jetzt direkt angebbar, außerdem kann jetzt auch minidjvu als Encoder-Programm verwendet werden.

so long
hank

aasche

Anmeldungsdatum:
30. Januar 2006

Beiträge: 14259

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Das Bild ist da (wenn ich deinem Link hier folge, wird es zumindest angezeigt) die Einbindung funktioniert anscheinend nicht... Ich werd' mal versuchen, es als eigenen Anhang hochzuladen, und dann einzubinden.

Danke für den Hinweis, könnte ein bug sein. Im tesseract-ocr-Artikel funktioniert es mit [[Bild(xsane/xsane-ocr.jpg, 18)]]

Ungültiges Makro

Dieses Makro ist nicht verfügbar

, hier auch, und jetzt auch im xsane2djvu-Artikel...

so long
hank

matzeSG

Anmeldungsdatum:
17. Februar 2013

Beiträge: 2

Hallo,

habe beim meiner lokalen Kopie des Scripts die Logik in Anlehnung zu xsane2sandwich abgeändert.

Wird eine vorhanden djvu Datei ausgewählt, so hänge ich die neue Seite automatisch an das bestehende Djvu-Datei an. Dadurch muss die -f Option nicht mehr geändert werden.

LG matze

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Automatisches Drehen der Vorlage ist auch für andere Skripte (xsane2tess, xsane2speech, xsane2sandwich etc.) nicht uninteressant. Ich hoffe, dass ein entsprechender Code bald in die offizielle Tesseract-Version integriert wird.

Ich hab' das für die anderen Skripte noch nicht durchgespielt; ggf sollte der Abschnitt etwas ausgebaut als Ergänzung zu tesseract-ocr als Kompilier-Artikel ausgelagert werden, von dem aus von den anderen Anleitungen verlinkt wird. Allerdings würde das obsolet, sobald es offiziell integriert würde.

Meinungen dazu?

so long
hank

Antworten |