staging.inyokaproject.org

PARLATYPE Transkriptionsprogramm um VoiceMessages als TEXT umwandeln

Status: Ungelöst | Ubuntu-Version: Lubuntu 20.04 (Focal Fossa)
Antworten |

659888

Avatar von 659888

Anmeldungsdatum:
21. September 2013

Beiträge: 601

Hallo Ubuntuusers,

Ich brauche Eure Hilfe.

Ich möchte z.Bsp. eine Voice WhatsApp Sprach-Message umwandeln in Text.

Hierzu habe ich im Internet etwas gefunden das eigendlich diese Anforderung sehr gut und leicht ausführt.

Die Rede ist hier von PARLATYPE, welches angeblich perfekt zu Ubuntu und Lubuntu passen soll.

Ich habe also die komplette PARLATYPE Installation mit der MUON Paketverwaltung gemacht.

Nun wollte ich mal ein Transkript von einer VOICE-Message nach TEXT umwandeln, aber irgendwie funktioniert das nicht.

Von PARLATYPE wird zwar die VOICE-Message korrekt und sauber als Ton-Ausgabe wieder gegeben, das scheint also OK zu sein, aber ich finde nicht die Möglichkeit diese in eine TEXT Datei umzuwandeln.

Könntet Ihr mich bitte mit Euren Tipps und Ratschlägen weiter helfen, den ich brauche diese Funktion schnellstmöglich?

Im Anhang seht Ihr auch, was ich bereits von PARLATYPE installiert habe.

Ich würde mich sehr über Eure Rückantworten freuen!

Bilder

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1201

Hi,

leider noch nicht ganz geschafft, aber hier ein Zwischenstand:

Die Version aus den Quellen mit v1.6.2-1 läuft bei mir auch nicht. Unter Einstellungen fehlt die Karteikarte Spracherkennung. Ich vermute hier muss noch mehr installiert werden, damit diese angezeigt wird.

Es gibt anscheinend ein Flatpak zu Parlatype auf Flathub. Hier wird diese Karteikarte Spracherkennung angezeigt. Also:

Flatpak installieren:

sudo apt-get update
sudo apt-get install flatpak

Das Parlatype flatpak von flathub.org installieren:

flatpak install flathub org.parlatype.Parlatype

Falls der Fehler "Fehler: No remote refs found similar to ‘flathub’" auftritt dann bitte folgendes ausführen und danach wie zuvor beschrieben erneut installieren:

flatpak remote-add --if-not-exists flathub https://flathub.org/repo/flathub.flatpakrepo

Quelle: https://itsfoss.com/no-remote-ref-found-flatpak/

Nach der Installation des flatpaks kann diese wie folgt gestartet werden:

flatpak run org.parlatype.Parlatype

Dann die Einstellungen öffnen und nun erscheint auch die Karteikarte Spracherkennung. Hier erscheint nun lediglich ein Button. Den Namen habe ich mir leider nicht gemerkt. Button drücken und man gelangt zur Sprachmodel-Konfiguration siehe Anlage. Über die DropdownList in der oben rechts Unterstützt steht kann man sehen, das derzeit noch keine Sprachmodelle installiert sind, wenn man die DropdownList auf installiert umstellt. Also wieder alle unterstützten anzeigen und z.B. Skribosermo Deepspeech auswählen und auf auf den editierButton unten rechts klicken.

Es öffnet sich das Fenster Skribosermo Deepspeech (siehe Anhang). Hier bitte der Installationsanleitung folgen und die zwei Dateien herunterladen und abschließend den Ordner auswählen in welchem diese zwei Dateien nun liegen.
Wichtig: Danach das Fenster schließen und in dem noch offenen Fenster auf der Karteikarte Sprachmodel-Konfiguration auf Skribosermo Deepspeech doppelt klicken. Dann erscheint am ende der Zeile ein Erledigt-Haken.

Nun kann das Einstellungsfenster wieder geschlossen werden. Wenn man nun im Hauptfenster wieder auf den Zahnradbutton Klickt erscheint nun endlich die Optionsbox Manuelle Transkription und Automatische Transkription.

So weit so gut. Jetzt fehlt nur noch die Integration in LibreOffice. Ich gehe davon aus, das mit dem Flatpak eben diese parlatype-libreoffice-extension noch nicht mit installiert wurde. Wie Sie installiert wird sehe ich noch nicht. der Link hierzu lautet: https://salsa.debian.org/gkarsay/parlatype-libreoffice-extension Gerne kann mir jemand zuvorkommen und beschreiben wie man diese Extension installiert.

Noch ein paar hilfreiche Links zu Parlatype:

Grundsätzlich interessant zu dem Thema ist wohl auch die Frage woher bekommt man Sprachdateien wohl möglich in vielen verschiedenen Sprachen. Eine schöne Quelle hierzu wäre: https://audio-lingua.eu/?lang=de

Bearbeitet von Thomas_Do:

Link auf Nutzerwunsch korrigiert.

Bilder

659888

(Themenstarter)
Avatar von 659888

Anmeldungsdatum:
21. September 2013

Beiträge: 601

Hallo sh4711,

Als Erstes meinen besten Dank für Deine Ausführungen, ich muss Dich loben, Du hast die Beschreibung sehr gut und auch für einen nicht Informatiker sehr gut und detailliert verständlich erstellt.

Habe sofort alles so gemacht wie von Dir beschrieben und ist auch soweit gut abgelaufen.

Nun bin ich auch an dem Punkt angekommen, der uns noch von einem vollständigen Funktionieren trennt, und zwar ist dies:

Jetzt fehlt nur noch die Integration in LibreOffice.

Ich denke, dass dies doch auch irgendwie möglich sein soll.

Hast Du diesbezüglich schon etwas herausgefunden?

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1201

659888 schrieb:

Als Erstes meinen besten Dank für Deine Ausführungen, ich muss Dich loben, Du hast die Beschreibung sehr gut und auch für einen nicht Informatiker sehr gut und detailliert verständlich erstellt. ...

Gern geschehen ... das Thema hat mich auch interessiert.

... Jetzt fehlt nur noch die Integration in LibreOffice. ... Hast Du diesbezüglich schon etwas herausgefunden?

Stand jetzt ... nein. Ich muss aber auch gestehen, dass ich mich temporär einem anderen Problem zugewandt habe. 😢 Ich versuche es in den nächsten Tagen, mit etwas Abstand nochmals erneut.

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1201

sh4711 schrieb:

... Ich versuche es in den nächsten Tagen, mit etwas Abstand nochmals erneut.

OK, ein paar Tage später mit etwas Abstand kann ich dir sagen, das Parlatype das was du willst gar nicht kann.

659888 schrieb:

Hallo Ubuntuusers, ... Ich möchte z.Bsp. eine Voice WhatsApp Sprach-Message umwandeln in Text.

Hierzu habe ich im Internet etwas gefunden das eigendlich diese Anforderung sehr gut und leicht ausführt.

Die Rede ist hier von PARLATYPE, welches angeblich perfekt zu Ubuntu und Lubuntu passen soll. ...

Auf der Seite von Parlatype heißt es:

Parlatype is a minimal audio player for manual speech transcription, ...

D. h. Parlatype ist eine Art Abspielgerät ähnlich wie bei Diktiergeräten ... den Text tippen musst du aber selber!

Das was du suchst ist eine Spracherkennungssoftware (Speech Recognition Tool). Schaue dir mal bitte folgende Links dazu an. Hier werden einige solcher Programme vorgestellt:

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1201

@admins: diesen Post bitte, wenn möglich, nicht abtrennen.

sh4711 schrieb:

... Auf der Seite von Parlatype (Link auf Stand heute korrigiert) heißt es:

Parlatype is a minimal audio player for manual speech transcription, ...

D. h. Parlatype ist eine Art Abspielgerät ähnlich wie bei Diktiergeräten ... den Text tippen musst du aber selber! ...

Hier muss ich mich korrigieren. Das ist so nicht ganz richtig. Es gibt lauf Featurelist das folgende versteckte Feature:

Automatic speech recognition

This is a working feature (since version 1.6), however, it’s hidden by default (since version 1.6.1).

You have to find and download speech model data for your language. This step is described in the help pages but I can’t give any support beyond that.

The results for general speech recognition are not overwhelming with the current ASR engine and given the fact that many languages are missing speech model data, this feature is only shown, if Parlatype is run using the option --with-asr.

Distributions may decide to compile Parlatype without this feature.

Aktuell kann hierzu anscheinend pocketsphinx verwendet werden, da auf der Github-Seite von Parlatype darauf verwiesen wird.

Antworten |