burli
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Mir ist gestern mal wieder eine Idee durch den Kopf geschossen. Ich weiß aber nicht, ob es sowas schon gibt. Die Idee ist, ein Programm ließt einen Text satzweise ein. Diesen Satz schickt er an Google Translate. Den Original Satz und die Übersetzung zeigt er jeweils in einer Textbox an. In einer dritten Textbox kann man dann die richtige Übersetzung eingeben. Ich weiß, dass Google häufig Blödsinn liefert. Aber die Übersetzung kann zumindest Ansätze liefern und vielleicht Wörter übersetzen, die man ansonsten im Wörterbuch nachschlagen muss. In manchen Fällen, bei einfachen und kurzen Sätzen, kann man den von Google gelieferten Satz sogar direkt übernehmen In Python sollte das kein Problem sein. Es gibt sogar schon ein Script für die API
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Ich hab mal eine einfache Version für die Konsole geschrieben Translation Helper Den Code für die Google API hab ich von hier. Das kann man natürlich noch mit einer GUI schmücken und ein paar Eingabehilfen hinzufügen. Funktioniert eigentlich ganz gut, nur manchmal verwirren die Übersetzungen mehr als sie helfen 😉
|
Vegeta
Anmeldungsdatum: 29. April 2006
Beiträge: 7943
|
So was kann manchmal sehr nützlich sein, habe das in meinem eigenen Editor auch eingebaut. Kann einzelne Wörter oder Sätze übersetzen, benutze dafür aber Yahoo! Babel Fish. Ich würde das an deiner Stelle in einen Editor einbauen, lässt sich mit Qt sehr schnell und einfach realisieren. Hattest du nicht mal geschrieben, dass du einen eigenen Editor schreiben wolltest?! ☺
- Bilder
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Vegeta schrieb: So was kann manchmal sehr nützlich sein, habe das in meinem eigenen Editor auch eingebaut. Kann einzelne Wörter oder Sätze übersetzen,
Ich bin darauf gekommen, weil ich gerade CouchDB - Die Definitive Referenz lese und nur die ersten Kapitel ins deutsche übersetz sind. Das Programm wäre also nicht für Spontanübersetzungen einzelner Worte oder Sätze sondern von ganzen Texten gedacht.
benutze dafür aber Yahoo! Babel Fish.
Ich hab jetzt nur mal spontan Google genommen, weil mir der Code dafür über den Weg gelaufen ist.
Ich würde das an deiner Stelle in einen Editor einbauen, lässt sich mit Qt sehr schnell und einfach realisieren.
Wie gesagt, gedacht ist es für größere Texte. So das man Satz für Satz übersetzen kann, eventuell Sätze auslassen kann falls man damit nicht weiter kommt usw. Vielleicht entfernt vergleichbar mit Qt Linguist. Man könnte auch weiter gehen und bei HTML Seiten die Formatierung übernehmen usw. Von daher würde das denke ich eher ein eigenständiges Programm als ein Editor Plugin.
Hattest du nicht mal geschrieben, dass du einen eigenen Editor schreiben wolltest?! ☺
Wollte ich, aber nachdem ich JuffEd gefunden habe hab ich das aufgegeben. JuffEd kommt meinen Vorstellungen bisher noch am nächsten und ich werde da vielleicht das eine oder andere Plugin für schreiben.
|
Vegeta
Anmeldungsdatum: 29. April 2006
Beiträge: 7943
|
burli schrieb: Ich bin darauf gekommen, weil ich gerade CouchDB - Die Definitive Referenz lese und nur die ersten Kapitel ins deutsche übersetz sind. Das Programm wäre also nicht für Spontanübersetzungen einzelner Worte oder Sätze sondern von ganzen Texten gedacht.
Über Yahoo! Babel Fish kann man auf einmal mehrere KiB auf einmal übersetzen lassen, weiß nicht wo bei Google das Limit ist. Es ist aber keinesfalls auf einzelne Wörter oder Sätze beschränkt. Leider ist die Qualität der Übersetzung oft aber mangelhaft. ☺
Wie gesagt, gedacht ist es für größere Texte. So das man Satz für Satz übersetzen kann, eventuell Sätze auslassen kann falls man damit nicht weiter kommt usw. Vielleicht entfernt vergleichbar mit Qt Linguist. Man könnte auch weiter gehen und bei HTML Seiten die Formatierung übernehmen usw. Von daher würde das denke ich eher ein eigenständiges Programm als ein Editor Plugin.
Klingt interessant, wobei aber die Beibehaltung der Formatierung die Bearbeitung wieder erschweren würde, wenn der HTML-Source mit angezeigt wird. Könnte man zwar auch trennen, also die Ansicht und die interne Verarbeitung, würde die Programmierung aber wesentlich komplizierter machen.
Wollte ich, aber nachdem ich JuffEd gefunden habe hab ich das aufgegeben. JuffEd kommt meinen Vorstellungen bisher noch am nächsten und ich werde da vielleicht das eine oder andere Plugin für schreiben.
Ich benutze seit einiger Zeit ziemlich gerne Geany, auch ein sehr schöner Editor.
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Vegeta schrieb: Über Yahoo! Babel Fish kann man auf einmal mehrere KiB auf einmal übersetzen lassen, weiß nicht wo bei Google das Limit ist. Es ist aber keinesfalls auf einzelne Wörter oder Sätze beschränkt. Leider ist die Qualität der Übersetzung oft aber mangelhaft. ☺
Google beschränkt das anscheinend auf 4500 Byte. Jedenfalls gibt es im Programm eine Funktion, die zu lange Texte splittet. Komplette Texte übersetzen lassen ist aber auch nicht das Ziel und wenig sinnvoll IMHO
Klingt interessant, wobei aber die Beibehaltung der Formatierung die Bearbeitung wieder erschweren würde, wenn der HTML-Source mit angezeigt wird. Könnte man zwar auch trennen, also die Ansicht und die interne Verarbeitung, würde die Programmierung aber wesentlich komplizierter machen.
In einem Feld soll der Original Text in der Original Formatierung angezeigt werden. Der Satz oder Abschnitt, der gerade übersetzt werden soll, soll farblich markiert werden. So soll man immer auch den Kontext vor Augen haben. Ohne den wäre Übersetzen manchmal nicht möglich. Bei HTML könnte ich mir vorstellen, dass die HTML Formatierung einfach nicht mit angezeigt wird. Es wird einfach nur ein HTML Element nach dem anderen genommen, der Text herausgefiltert, übersetzt und die Übersetzung wieder in die HTML Formatierung eingefügt. Der Übersetzer kommt dann nicht damit in Berührung.
Ich benutze seit einiger Zeit ziemlich gerne Geany, auch ein sehr schöner Editor.
Den nutze ich auch überwiegend. JuffEd ist noch nicht ganz auf dem Niveau von Gedit. Aber ich hoffe, er ist irgendwann da.
|
Vegeta
Anmeldungsdatum: 29. April 2006
Beiträge: 7943
|
burli schrieb: Bei HTML könnte ich mir vorstellen, dass die HTML Formatierung einfach nicht mit angezeigt wird. Es wird einfach nur ein HTML Element nach dem anderen genommen, der Text herausgefiltert, übersetzt und die Übersetzung wieder in die HTML Formatierung eingefügt. Der Übersetzer kommt dann nicht damit in Berührung.
Da hast du ja noch einiges vor, wünsche dir auf jeden Fall viel Erfolg, vielleicht findet sich ja noch jemand der sich in Python auskennt. Beim Akinator-Projekt haben sich ja einige Helfer gefunden.
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Ich hab im Qt Designer man schnell was zusammengeklickt. Das ist jetzt nur so grob das, was ich mir vorstellen könnte. Es ist noch kein fertiges Programm sondern nur ein Mockup. Aber das wäre so der erste Milestone. Wie weit ich damit komme bzw wie schnell weiß ich nicht. Ich habe ein Projekt mit höherer Priorität und ich habe das jetzt nur mal eingeschoben, weil mich die Idee nicht losgelassen hat. Ich habe keine Idee, ob überhaupt Bedarf für sowas besteht bzw ob ich das mal gebrauchen kann.
- Bilder
|
Paycheck
Anmeldungsdatum: 19. Juni 2006
Beiträge: Zähle...
|
Was ich mir auch gut vorstellen kann, wäre die Funktion bestimmte Passagen von der Übersetzung auszuschließen, um zum Beispiel Quelltext nicht unnötig übersetzen zu lassen.
Weiterhin wäre es praktisch bestimmte Wörter und Wortkombinationen (z.B. Namen und Fachbegriffe) ebenfalls auszuschließen. So könnte man sich schnell ein kleines Wörterbuch zum jeweiligen Text erzeugen und dadurch die Übersetzung nicht ganz so verwirrend werden lassen.
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Paycheck schrieb: Weiterhin wäre es praktisch bestimmte Wörter und Wortkombinationen (z.B. Namen und Fachbegriffe) ebenfalls auszuschließen. So könnte man sich schnell ein kleines Wörterbuch zum jeweiligen Text erzeugen und dadurch die Übersetzung nicht ganz so verwirrend werden lassen.
Darüber hab ich schon nachgedacht. Es ist allerdings schwierig, dass Google beizubringen. Man müsste einen Satz nochmal zerlegen und einzeln an Google schicken (oder welche Übersetzungs-API auch immer), aber dann würde die Übersetzung aus dem Kontext gerissen. Es sei denn, man kann Google einzelne Wörter mit einem "do not translate" Tag übergeben.
|
Paycheck
Anmeldungsdatum: 19. Juni 2006
Beiträge: 24
|
burli schrieb: Darüber hab ich schon nachgedacht. Es ist allerdings schwierig, dass Google beizubringen. Man müsste einen Satz nochmal zerlegen und einzeln an Google schicken (oder welche Übersetzungs-API auch immer), aber dann würde die Übersetzung aus dem Kontext gerissen. Es sei denn, man kann Google einzelne Wörter mit einem "do not translate" Tag übergeben.
Das könnte man doch dann lokal im entsprechenden Textfeld verarbeiten. Also man müsste erstmal markieren was Google aus dem Begriff macht und benutzt dann ne automatische Suchen/Ersetzen-Funktion oder so. Das müsste man ausprobieren.
Oder man ersetzt den jeweiligen Begriff durch eine Zeichenkette die Google auf keinen Fall ersetzen kann (z.B. @@00001@@ für das erste nicht zu übersetzende Wort). Solch eine Funktion würde das ganze aber zu einem spitzen Tool machen. Vielleicht sogar lernfähig oder so. 😉
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Hm, ich glaube, so ein Programm wäre gegen die Nutzungsbedingungen von Google. http://www.google.com/accounts/TOS?hl=de&loc=DE Oder verstehe ich das falsch?
Sie sind nicht berechtigt, die Dienste in missbräuchlicher Art und Weise zu nutzen, in die Dienste einzugreifen oder auf die Dienste in anderer Weise als über die von Google bereitgestellten Benutzeroberflächen und/oder Schnittstellen zuzugreifen.
Ich weiß jetzt nicht, ob da eine "legale" API von Google verwendet wird.
|
Paycheck
Anmeldungsdatum: 19. Juni 2006
Beiträge: 24
|
Sie sind nicht berechtigt [...] auf die Dienste in anderer Weise als über die von Google bereitgestellten [...] Schnittstellen zuzugreifen.
Es wird doch über die von Google Bereitgestellte Schnittstelle (API) in nicht missbräuchlicher Weise auf den Dienst zugegriffen. Und eingegriffen wird in den Dienst ja auch nicht. EDIT: Ach jetzt hab ich's verstanden. Das Skript im Eingangspost ist nichts offizielles oder du weißt es nicht. Das müsste man natürlich in Erfahrung bringen. EDIT 2: (SORRY) http://code.google.com/intl/de/apis/language/translate/overview.html Also es gibt ja doch ne offizielle API. Also wenn man die nutzt wäre es doch wieder vereinbar. Von "nicht in eigene Software einbinden" steht in den Bedingungen ja nichts. Nachtrag: Auszug aus http://code.google.com/intl/de/apis/language/translate/v2/getting_started.html: Introduction This document is intended for developers who want to write applications that can interact with the Google Translate API. Google Translate is a tool that automatically translates text from one language to another language (e.g. French to English). You can use the Google Translate API to programmatically translate text in your webpages or apps.
|
burli
(Themenstarter)
Anmeldungsdatum: 27. April 2007
Beiträge: 8985
|
Ah, super, danke für's Raussuchen. Hatte die API noch nicht gefunden.
|