busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Hallo habe Gespeaker nicht installiert, werd es aber damit auch noch mal testen.Was auf jeden Fall funktioniert ist z.B das hier espeak -v mb-de6 -f mittagstisch.txt | mbrola -e /usr/share/mbrola/voices/de6 - test.wav Ich hab auch mal in /usr/share/doc/espeak/mbrola.html geschaut.Dort steht u.a.
These voice files are in eSpeak's directory espeak-data/voices/mbrola Diese Verzeichnis gibt es bei mir so aber nicht, bei mir heißt es espeak-data/voices/mb Gruß...busfahrer €dit: Mit Gspeaker funktioniert die mbrola-Stimme fehlerfrei.
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
Hi! busfahrer schrieb:
€dit: Mit Gspeaker funktioniert die mbrola-Stimme fehlerfrei.
Das ist ja sehr merkwürdig... Und kann eSpeak die Mbrola-Stimmen auch direkt nutzen, also gibt es eine Ausgabe für espeak -vmb-de6 "zusprechenderText" Das sollte nämlich so gehen; jedenfalls läuft das bei mir so, und das Skript basiert darauf... so long hank
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Heinrich Schwietering schrieb: Und kann eSpeak die Mbrola-Stimmen auch direkt nutzen
Leider nicht.Wenn ich das versuche espeak -vmb-de6 "Das ist ein ausgedachter Text" bleibt alles stumm und das Terminal sagt
bt_audio_service_open: connect() failed: Connection refused (111)
bt_audio_service_open: connect() failed: Connection refused (111)
bt_audio_service_open: connect() failed: Connection refused (111)
bt_audio_service_open: connect() failed: Connection refused (111)
d 65
a 17 0 94 80 95 100 95
s 102
? 65
I 16 0 96 80 97 100 97
s 64
t 65
? 65
aI 40 0 97 80 98 100 98
n 114 100 89
? 65
aU 54 0 118 80 110 100 110
s 72
g 65
@ 16 0 110 80 106 100 106
d 65
a 20 0 118 80 110 100 110
x 86
t 60
6 18 0 110 80 106 100 106
t 89
E 52 0 102 80 75 100 75
k 84
s 48
t 65
_ 301
_ 1
Gruß....busfahrer
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
Hi! DAs bedeutet zumindest, dass der Text verarbeitet wird, aber die Umsetzung erfolgt nicht... Welche eSpeak version ist das? Kannst du vrsuchen, weine neuere zu installieren? AUs dem Quellcode, oder versuchen, ein neueres Paket zu verwenden? so long hank
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Heinrich Schwietering schrieb: Welche eSpeak version ist das?
Meine Version ist 1.43.03-0ubuntu1.Hab mir von der espeak-Seite mal die fertige Version 1.44.05 geholt, aber damit ist das Ergebnis das selbe. Gruß....busfahrer
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
Hi! In diesem ubuntuforums-thread steht was vom paket bluez-alsa, das die Fehlermeldung verursachen soll - brauchst du bluetooth? Wenn nicht, kannst ja mal versuchen, das zu entfernen. Aber noch was ganz anders Kennst du dich mit sed aus? Bräuchte eine Befehl der die Kombination zweier beliebiger Buchstaben mit einer beliebeigen Zahl in zwei Buchstaben - leerstelle-Zahl auflöst, also aus TZ6 dann TZ 6 machen kann; sowohl für Großbuchstaben, als auch Klein (für die Festival-Stimmen, die steigen z.T. bei solchen Komibinationen aus...) so long hank
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Hallo habe das Paket bluez-alsa mal entfernt.Ich bekomme zwar jetzt die Meldung bt_audio_service_open: connect() failed: Connection refused (111) nicht mehr, aber ansonsten hat sich nichts geändert.Hätte mich auch gewundert wenn das des Rätsels Lösung wäre.Ich bin jetzt mal hingegangen und habe Gespeaker mal im Terminal gestartet.Mit der mbrola-Stimme nimmt das Prog wohl diese Einstellungen ['/usr/bin/espeak', '-a', '100', '-p', '50', '-s', '170', '-g', '10', '-v', 'mb-de6', '-f', '/tmp/gespeakermhjCUd'] ['/usr/bin/mbrola', '-e', '/usr/share/mbrola/voices/de6', '-', '/tmp/gespeaker.wav'] ['aplay'] Vielleicht hilft das ja beim Aufspüren des Problems. Heinrich Schwietering schrieb: Aber noch was ganz anders Kennst du dich mit sed aus?
Da kann ich dir leider garnicht helfen, sorry Gruß....busfahrer
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
Hi! busfahrer schrieb: .Mit der mbrola-Stimme nimmt das Prog wohl diese Einstellungen ['/usr/bin/espeak', '-a', '100', '-p', '50', '-s', '170', '-g', '10', '-v', 'mb-de6', '-f', '/tmp/gespeakermhjCUd'] ['/usr/bin/mbrola', '-e', '/usr/share/mbrola/voices/de6', '-', '/tmp/gespeaker.wav'] ['aplay'] Vielleicht hilft das ja beim Aufspüren des Problems.
Ist also wie ich vermutet hatte: Da wird ein expliziter mbrola-Aufruf für diese Stimmen verwendet; das könnt man im Skript auch so machen, für die Aufnahmen der Festival-Stimmen hab' ich so einen "Umweg" über eine temporäre .wav-Datei genommen, da dort die Ausgabe auch nicht "direkt" an lame "gepipt" werden konnte. In der älteren
Skripte/Book-To-MP3 Version ist das ähnlich geregelt, allerdings ohne aplay, sondern dann nach lame umgeleitet. Versuch mal statt sowas wie `"$ESPEAK" $SYNSET -f "$FILE_OUT"` 1>&2 "$ESPEAK" $SYNSET -f "$FILE_OUT" -w -.wav | mbrola -e -t 1.15 -f 0.9 /usr/share/mbrola/de6/de6 - -.wav | aplay 1>&2 Hab's noch nicht getestet, werd' das aber mal auf die TO-DO-Liste setzen, wenn ich dabei bin das für Lucid nochmal auf Herz und Nieren zu Testen.
Aber noch was ganz anders Kennst du dich mit sed aus?
Da kann ich dir leider garnicht helfen, sorry
Naja, muss ich mal weiter forschen. Weiß das vielleicht jemand anders? (oder sind wir hier eher "unter uns"? 😉) so long hank
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Hallo habe nun ein wenig experimentiert und kann nun vermelden das folgendes zum Erfolg geführt hat.
Ich habe im Skript noch eine Variable TEMP_WAV angelegt.Dieser Teil sähe jetzt so aus TEMP_DIR=~/tmp/ # folder for temporary files (TIFF & tesseract data)
TEMP_WAV=temp.wav # filename for temporary wave-file
ERRORLOG="xsane2speech.log" # file where STDERR goes
ESPEAK=espeak
CUNEIFORM=cuneiform
FESTIVAL=~/festival/festival/bin #path for festival and text2wave
TESSERACT=tesseract
USER=~/Dokumente/Vorlesen
Dann habe ich den relevanten Teil im Skript so verändert
`"$ESPEAK" $SYNSET -f "$FILE_OUT" | mbrola -e /usr/share/mbrola/voices/de6 - "$TEMP_DIR""$TEMP_WAV" && aplay "$TEMP_DIR""$TEMP_WAV"` 1>&2
rm "$TEMP_DIR""$TEMP_WAV"
echo "eSpeak with options $SYNSET used for utterance" 1>&2 Ich hoffe damit kannst du weiter arbeiten ☺ Gruß...busfahrer
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
busfahrer schrieb: Hallo habe nun ein wenig experimentiert und kann nun vermelden das folgendes zum Erfolg geführt hat.
Ich habe im Skript noch eine Variable TEMP_WAV angelegt.Dieser Teil sähe jetzt so aus TEMP_DIR=~/tmp/ # folder for temporary files (TIFF & tesseract data)
TEMP_WAV=temp.wav # filename for temporary wave-file
ERRORLOG="xsane2speech.log" # file where STDERR goes
ESPEAK=espeak
CUNEIFORM=cuneiform
FESTIVAL=~/festival/festival/bin #path for festival and text2wave
TESSERACT=tesseract
USER=~/Dokumente/Vorlesen
Dann habe ich den relevanten Teil im Skript so verändert
`"$ESPEAK" $SYNSET -f "$FILE_OUT" | mbrola -e /usr/share/mbrola/voices/de6 - "$TEMP_DIR""$TEMP_WAV" && aplay "$TEMP_DIR""$TEMP_WAV"` 1>&2
rm "$TEMP_DIR""$TEMP_WAV"
echo "eSpeak with options $SYNSET used for utterance" 1>&2
Ich hoffe damit kannst du weiter arbeiten ☺
Ich? Eher du 😉 Danke, ich teste das demnächst mal. Bin gerade mit meine Ersetzungen schon ein gutes Stück weiter gekommen, frostschutz war so nett, mir bei den sed-Geschichten unter die Arme zu greifen... Gibt also demnächst eine neue Version, die kann dann seltsame Zeichen von Cuneiform und "NeuDeutschWörter" in Neudeutschwörter zerlegen, damit sie nicht buchstabiert werden (macht das deutsche Festival zumindest...) Muss nur noch ein bisschen feilen... so long hank
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Hallo habe das Skript jetzt mal so bearbeitet das es bei mir unter 10.04 mit tesseract und espeak läuft.Es funktioniert alles, also Textpassagen anhängen, direkte Sprachausgabe, speichern in mp3.Das Problem ist jetzt nur das es so nur mit mb-de6 funktioniert.Würde ich in xsane -vmb-de7 nehmen, müsste man die entsprechenden Passagen im Skript von Hand ändern.Wenn ich in xsane -vde nehme, dann funktioniert zwar noch die direkte Sprachausgabe, aber es kann keine mp3 mehr gespeichert werden.Um das zu erreichem müßte man wohl $SYNSET auswerten und je nach Spracheinstellung noch was mit if/else machen.Ich häng das Skript mal an in der Hoffnung es hilft dir. Gruß...busfahrer
- xsane2speech_bearbeitet_für_10.04.sh (6.1 KiB)
- Download xsane2speech_bearbeitet_für_10.04.sh
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
Hi! Danke dir! An dem Punkt muss ich morgen wohl mal ansetzen; ggf. müsste man eine eigene Option für die Mbrola-Stimme in eSpeak einbauen, das ginge dann auch für die anderen Mbrola-Sprachen/Stimmen. Ich habe gerade noch die Option angebaut, nach dem Anhören noch eine mp3 daraus zu machen, wäre ja sinnvoll, wenn man erst anhört, was es ist, und dann entscheidet, dass man es dauerhafter haben möchte. Hab' den Aufnahmeteil einfach nochmal angehängt; das geht sicher eleganter, vielleicht fällt dazu ja jemandem was ein 😉 so long hank
- xsane2speech6.sh (8.2 KiB)
- Download xsane2speech6.sh
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Heinrich Schwietering schrieb: Ich habe gerade noch die Option angebaut, nach dem Anhören noch eine mp3 daraus zu machen, wäre ja sinnvoll, wenn man erst anhört, was es ist, und dann
entscheidet, dass man es dauerhafter haben möchte. Hab' den Aufnahmeteil einfach nochmal angehängt
Hab den Teil in meine Skript-Variante eingebaut und funktioniert 👍 Gibt es eigentlich eine Möglichkeit das ganze abzubrechen wenn man sich den Text direkt vorlesen läßt und wenn nicht, könnte man das einbauen? Gruß...busfahrer
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11288
|
Hi! Ja, das mit dem Abbrechen hab' ich auch gerade am Wickel, aber dafür müsste man während des Vorlesens wohl den entsprechenden Wiedergabe-Prozess (eSpeak oder Festival, müsste aber noch mal schauen, was da genau passiert) abwürgen... Ich will es zumindest noch so verändern, dass bei "abrechen" in den Zenity-Fenstern tatsächlich abgebrochen wird, man also zumindest direkt auf die XSane-Ebene zurückkommt, momentan ist es schlampig "programmiert", sodass einfach mit dem nächsten Punkt weitergemacht wird, wenn nicht die erwartetet Eingabe erfolgt... Bekomme gerade mein lucid-VM nicht vernünftig in Gang, sobald das wieder geht, versuch ich mich daran nochmal; theoretisch sollte es machbar sein, auch da die mbrola-Stimmen "umzuschalten". Darfst aber gerne auch selbst versuchen, da hinzukriegen 😉. In der Version die ich hier hochgeladen habm ist im Übrigen wohl ein bug; nichts schlimmes, aber man wird auch nach Abspeichern der MP3 (bei der Erstauswahl statt Wiedergabe)
nochmal gefragt, ob man abspeichern möchte. In der im Baustelle/xsane2speech-Wiki hab'ich da bereinigt. so long hank
|
busfahrer
Anmeldungsdatum: 9. April 2007
Beiträge: 3052
|
Heinrich Schwietering schrieb: In der Version die ich hier hochgeladen habm ist im Übrigen wohl ein bug; nichts schlimmes, aber man wird auch nach Abspeichern der MP3 (bei der Erstauswahl statt Wiedergabe)
nochmal gefragt, ob man abspeichern möchte.
Getestet und für gut befunden 👍 Heinrich Schwietering schrieb: heoretisch sollte es machbar sein, auch da die mbrola-Stimmen "umzuschalten".Darfst aber gerne auch selbst versuchen, da hinzukriegen
Ich hab ja schon so einiges versucht, aber es will nicht funktionieren.Sollte ich noch eine zündende Idee haben, lasse ich natürlich nichts unversucht 😉 Gruß....busfahrer
|