staging.inyokaproject.org

Paperwork

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |
Dieses Thema ist die Diskussion des Artikels Paperwork.

Heinrich_Schwietering Team-Icon

Wikiteam
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Ziemlich geniales Teil, über das ich bei der Suche nach automatischem Drehen von Scanvorlagen gestolpert bin. Das Programm hat zwar noch ein paar Macken, aber die Idee ist IMHO echt Klasse. Kann jemand das mit dem python-imaging unter Presice statt pillow (ein Fork von python-imaging) vielleicht noch mal testen? Ich hatte pillow zumindest für Version 0.1 definitiv nicht auf dem Rechner; und das pyocr-Teil ist auch erst letztens für 0.1.1 als Abhängigkeit dazugekommen. Wegen der Paket-Installationsprobleme schreib ich den Entwickler ggf. nochmal an...

Artikel ist ziemlich fertig, es fehlt noch ein Shot vom Hauptfenster, da muss ich erstmal "unverfängliches" Material einscannen 😉

Ansonsten: fundierte Kritik, Lob und Tadel, Anmerkungen, eigene Erfahrungen, Fragen und Wünsche wie immer willkommen!

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

So, von mir aus erstmal fertig (jetzt mit Schokokeksrezept 😉 !)

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Hab' dem Entwickler meine Fragen hingeschickt (siehe https://groups.google.com/forum/#!topic/paperwork-gui/IEc_gSX3eM8), eine neue Version des Programms ist anscheinend in der Mache, mal sehen, was noch zu kommt...

so long
hank

aasche

Anmeldungsdatum:
30. Januar 2006

Beiträge: 14259

Soweit ok, nur diesen Satz wuerde ich sinngemaess und nicht woertlich uebersetzen:

Das Motto des Programms lautet "Using OCR to grep dead trees the easy way" (in etwa: Texterkennung nehmen, um tote Bäume ganz einfach auszulesen...).

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

@ aasche thx! ☺

zur Übersetzung: Naja, das ist ja der Gag an der Sache. Gaaanz wörtlich wäre sogar "Texterkennung nutzen um tote Bäume auf die einfache Weise zu grepen", 'grep' gibts nur im Zusammenhang mit Computern, und den Gag mit den toten Bäumen mit "Papier" zu übersetzen ist so ähnlich, wie meiner Frau TOM-Comics aus der TAZ zu erklären 😀 Aber der Autor von Paperwork ist Franzose 🐸

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Die angekündigten Änderungen werden wohl etwas brauchen, ggf. ist die deutsche Übersetzung bald allgemein greifbar. Ich würde also verschieben, wenn nichts dagegen spricht?

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

HI!

Spricht also nichts dagegen...Also: Paperwork jetzt im Wiki. Werde es überallhin verlinken 😉

so long
hank

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Hier die Anweisungen, um die Github-Version mit der dt.Übersetzung zu nutzen, solange es keine offizielle 0.1.2 Version gibt. Empfehlenswert scheint folgendes Vorgehen in folgender Reihenfolge (build-essential und checkinstall werden vorausgesetzt)

zunächst die Abhängigkeiten installieren:

  1. pillow in Version 2.2.1 ⮷, herunterladen und entpacken, benötigt werden zuvor

    1. libtiff4-dev libjpeg8-dev zlib1g-dev libfreetype6-dev liblcms1-dev libwebp-dev tcl8.5-dev tk8.5-dev.

    2. pillow dann mit sudo checkinstall python setup.py install bauen und installieren. Konflikte mit dem Paket python-imagong sind nicht zu erwarten, da die Installation bei checkinstall nach usr/local erfolgt

  2. die Programme pyocr und pyinsane, (benötigt wird libsane), jeweils mit sudo checkinstall python setup.py install bauen

Dann die Paperwork-Version mit der deutschen Übersetzung bauen:

  1. Paperwork, zip-Datei herunterladen und entpacken

    1. benötigt werden python-pip python-setuptools python-dev python-enchant python-pycountry python-whoosh python-nltk (zieht python-yaml mit sich)

    2. Im Paperwork-Verzeichnis das skript localize.sh mit der Option gen-mo aufrufen, Befehl ./localize.sh gen-mo, es erstellt die Übersetzungen (es gab erstaunlicherweise bei mir Probleme, ohne den Aufruf "verschwand" die Übersetzung nach einem Rechner-Neustart, mit diesem "Trick" ließ sie sich erhalten... EDIT: Dachte ich, stimmt aber nicht ganz , siehe unten...)

    3. dann wieder sudo checkinstall python setup.py install durchführen.

Falls es Probleme mit der checkinstall-Routine gibt (Meldungen über Konflikte mit Dateien aus anderen Paketen) kann das jeweilige Paket (was ja erstellt, nur nicht installiert wurde), gefahrlos mit dem Befehl sudo dpkg --force overwrite --install PAKETNAME installiert werden.

Wenn es danach Problem mit dem Programm-Start gibt, kann man versuchen, das Index-Verzeichnis (~.local/paperwork/index) zu löschen, Paperwork erstellt dann bei Neustart einen neuen Index.

good luck!
hank

EDIT Auch die (neu-)Generierung der po/mo-File bringt nichts- nach Rechenneustart ist die Übersetzung jetzt doch wieder futsch... Muss ich wohl den Entwickler noch mehr löchern...

EDIT 2 Wundersame Welt der Schlangen... Wenn ich Paperwork aus dem Verzeichnis, in dem ich die po/mo-file generiert habe, im Terminal starte, geht es. Da scheint also wirklich irgendwas nicht hinzuhauen...

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Der Fehler mit der deutschen Übersetzung hat wohl folgenden Grund: Die deutsche Übersetzungsdatei paperwork.mo wird momentan nicht nach /usr/share/locale/de/LC_MESSAGES verschoben, insofern kann natürlich ein "allgemeiner" Start per dash etc. sie nicht finden, und die Oberfläche bleibt "denglisch". Sie muss also dementsprechend aus dem BUILDVERZEICHNIS/locale/de/LC_MESSAGES/ dorthin kopiert werden.

Warum es mit dem Start aus dem Verzeichnis direkt heraus funktioniert verstehe ich allerdings nicht. Aber egal, man kann wohl nicht alles verstehen...

so long
hank

nettozählt

Anmeldungsdatum:
21. Dezember 2013

Beiträge: 275

memo: Version 0.1.2 wurde am 29.12. veröffentlicht: "german translation updated" 😉

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Ach was...

so long
Hank

tux-flo

Avatar von tux-flo

Anmeldungsdatum:
27. August 2008

Beiträge: Zähle...

Hallo! Wollte grade das Programm nach der Anleitung im Wiki installieren und habe dann festgestellt das auf der github Seite unter "Ubuntu Installation" steht das ein simples

1
sudo pip install paperwork

ausreichend ist um das Programm zu installieren. Natürlich werden die Abhängigkeiten dennoch benötigt aber das wird während des Installationsprozesses auch angezeigt und sogar die entsprechenden Befehle zum installieren vorgeschlagen. Vielleicht kann der Wikiartikel abgeändert werden, denn ich befürchte das, dass selbstkompilieren für viele abschreckend wirkt.

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

Möglich ist das, im Artikel ist auch ein ähnliche Vorgehen mittels des setup.py-Skriptes beschrieben. Allerdings wäre das an der Paketverwaltung vorbei, und das wollte ich vermeiden.

so long
hank

apos

Avatar von apos

Anmeldungsdatum:
2. August 2007

Beiträge: 109

Hallo Leute,

ich bin mit der aktuellen Ubuntu 14.04 / 64 bit Version unterwegs. Die Anleitung befolgt. Um es vorneweg zu sagen: Die Kompilation und Installation mit checkinstall hat geklappt. Laufen tut es nicht!

Es hängt an diesem Fehler:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#>paperwork

Traceback (most recent call last):
  File "/usr/local/bin/paperwork", line 5, in <module>
    pkg_resources.run_script('paperwork==0.2.4-git', 'paperwork')
  File "/usr/lib/python2.7/dist-packages/pkg_resources.py", line 528, in run_script
    self.require(requires)[0].run_script(script_name, ns)
  File "/usr/lib/python2.7/dist-packages/pkg_resources.py", line 1401, in run_script
    exec(script_code, namespace, namespace)
  File "/usr/local/lib/python2.7/dist-packages/paperwork-0.2.4_git-py2.7.egg/EGG-INFO/scripts/paperwork", line 3, in <module>
    __requires__ = 'paperwork==0.2.4-git'
  File "build/bdist.linux-x86_64/egg/paperwork/paperwork.py", line 31, in <module>
  File "build/bdist.linux-x86_64/egg/paperwork/frontend/mainwindow/__init__.py", line 61, in <module>
  File "build/bdist.linux-x86_64/egg/paperwork/backend/docimport.py", line 30, in <module>
  File "build/bdist.linux-x86_64/egg/paperwork/backend/pdf/doc.py", line 27, in <module>
  File "build/bdist.linux-x86_64/egg/paperwork/backend/pdf/page.py", line 24, in <module>
  File "build/bdist.linux-x86_64/egg/paperwork/backend/common/page.py", line 24, in <module>
  File "/usr/local/lib/python2.7/dist-packages/scikit_image-0.11.3-py2.7-linux-x86_64.egg/skimage/feature/__init__.py", line 16, in <module>
    from .orb import ORB
  File "/usr/local/lib/python2.7/dist-packages/scikit_image-0.11.3-py2.7-linux-x86_64.egg/skimage/feature/orb.py", line 12, in <module>
    from .orb_cy import _orb_loop
  File "skimage/feature/orb_cy.pyx", line 16, in init skimage.feature.orb_cy (skimage/feature/orb_cy.c:17351)
  File "/usr/lib/python2.7/dist-packages/numpy/lib/npyio.py", line 734, in loadtxt
    fh = iter(open(fname, 'U'))
IOError: [Errno 2] Datei oder Verzeichnis nicht gefunden: '/usr/local/lib/python2.7/dist-packages/scikit_image-0.11.3-py2.7-linux-x86_64.egg/skimage/data/orb_descriptor_positions.txt'

Vielleicht kann ja einer die Hürde nehmen.

Ein Test mit pip ergab: "Requirement already satisfied"

1
2
3
4
#> sudo pip install scikit_image
Requirement already satisfied
Requirement already satisfied
...

Was funktioniert hat:

Installieren mit Checkinstall:

1
2
cd ~/mysources/zip_unpacked/...
checkinstall python setup.py install

Pillow konnte ich nicht mit checkinstall installieren, da beim Kompilieren folgender Fehler auftrat:

1
2
_imagingft.c:62:31: fatal error: freetype/fterrors.h: Datei oder Verzeichnis nicht gefunden
 #include <freetype/fterrors.h>

Hier half ein

1
sudo ln -s /usr/include/freetype2 /usr/local/include/freetype

Pyocr und Pyinsane:

  • Pyocr: hat funktioniert (Versionsnummer ändern. Siehe unten)

  • Pyinsane: hat funktioniert (Versionsnummer ändern. Siehe unten)

Allerdings musste ich zwei Paketnamen bei der Installation mit apt-get ändern:

1
2
"python-pillow" in "python-pil" 
"cuneiform-linux" in "cuneiform" 

Das sieht dann so aus:

1
sudo apt-get install libsane tesseract-ocr cuneiform python-pip python-setuptools python-dev python-pil python-enchant python-pycountry python-whoosh python-nltk  libtiff4-dev libjpeg8-dev zlib1g-dev libfreetype6-dev liblcms1-dev libwebp-dev  tcl8.5-dev  tk8.5-dev

Paperwork:

Es kommt beim Kompilieren von paperwork die Fehlermeldung:

1
ImportError: No module named scipy

Google: http://stackoverflow.com/questions/24808043/importerror-no-module-named-scipy

1
 sudo apt-get install python-scipy

Danach bekam ich eine Fehlermeldung von dpkg, als dieses das Paket installieren wollte:

1
2
dpkg-deb: Fehler: Parsen der Datei »/var/tmp/tmp.GJj8mcn2Gi/package/DEBIAN/control«, nahe Zeile 7 Paket »paperwork«:
 Fehler in Zeichenkette »stable-1« für Feld »Version«: Versionsnummer beginnt nicht mit einer Ziffer

Beim Aufruf von Checkinstall kann / muss die Versionsnummer geändert werden von "stable" zu "1.6.2" (in meinem Fall):

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
[...]

0 -  Maintainer: [ root@panama ]
1 -  Summary: [ Package created with checkinstall 1.6.2 ]
2 -  Name:    [ paperwork ]
<<HIER>> 3 -  Version: [ stable ]
4 -  Release: [ 1 ]
5 -  License: [ GPL ]
6 -  Group:   [ checkinstall ]
7 -  Architecture: [ amd64 ]
8 -  Source location: [ paperwork-stable ]
9 -  Alternate source location: [  ]
10 - Requires: [  ]
11 - Provides: [ paperwork ]
12 - Conflicts: [  ]
13 - Replaces: [  ]


Geben Sie die betreffende Nummer ein, um die Vorgaben zu ändern: 3
Geben Sie die neue Versionsbezeichnung ein: 
>> 1.6.2

ENTER

Dann klappts auch mit dem Installieren mit Checkinstall:

1
sudo checkinstall python setup.py install

Leider startet dann das Programm immer noch nicht:

1
ImportError: cannot import name Poppler

was mit

1
2
#> sudo apt-cache search poppler | grep gir
gir1.2-poppler-0.18 - GObject-Selbstprüfungsdaten für poppler-glib

und

1
sudo apt-get install gir1.2-poppler-0.18

gelöst werden kann.

Tja, dann startete es aber doch nicht wegen:

1
IOError: [Errno 2] Datei oder Verzeichnis nicht gefunden: '/usr/local/lib/python2.7/dist-packages/scikit_image-0.11.3-py2.7-linux-x86_64.egg/skimage/data/orb_descriptor_positions.txt'

Dieses Problem konnte ich nicht lösen.

Achso: die Konsole brachte folgendes Helferlein zum Vorschein:

1
paperwork-chkdeps

welches noch Abhängigkeiten nachinstallierte.

Hat aber nichts gebracht.

Grüße Axel

Heinrich_Schwietering Team-Icon

Wikiteam
(Themenstarter)
Avatar von Heinrich_Schwietering

Anmeldungsdatum:
12. November 2005

Beiträge: 11288

Hi!

ich verschiebe mir den Artikel in die Baustelle; mit der aktuellen Version hat das nicht mehr allzuviel zu tun, was Bedienung und Screenshots angeht.

so long
hank

Antworten |