Guten Abend,
aus einem Wiktionary-Dump, siehe https://dumps.wikimedia.org/dewiktionary/20190601/dewiktionary-20190601-pages-articles-multistream.xml.bz2, habe ich mittels grep alle in der Datei aufgeführten Hörbeispiel-Zeilen extrahiert. Nun gibt es regelmäßig 2, 3 oder mehr Hörbeispiel-Namen in einer Zeile. So eine Zeile sieht beispielsweise wie folgt aus:
:{{Hörbeispiele}} {{Audio|De-ich.ogg}}, {{Audio|De-ich2.ogg}}
Mein gewünschtes Ergebnis ist:
De-ich.ogg
De-ich2.ogg
Mit
1 | echo ":{{Hörbeispiele}} {{Audio|De-ich.ogg}}, {{Audio|De-ich2.ogg}}" | sed -ne 's/.*\(De-.*\.ogg\).*/\1/p' |
erhalte ich aber nur
De-ich2.ogg
Ist sed das geeignete Tool? Wenn ja, wo ist mein Fehler? Wenn nein, wie könnte eine Lösung aussehen? Sorry für diese womögliche Anfängerfrage, aber nach 1 1/2 Abenden Recherche bin ich 'etwas' zermürbt.
Vielen Dank für Eure Mühe
Je62