Google-Vision: Android als Dolmetscher

Von am 9. Februar 2010  

Wie ein Babelfisch soll das Android-Smartphone augenblicklich fremde Sprachen übersetzen. Die Brute-Force-Methode maschineller Übersetzungen lässt allerdings Missverständnisse befürchten. Googles Statistik-Algorithmen können viel, aber noch lange nicht alles. Sie übersetzen im Radebrech-Stil und manchmal ganz falsch.

Das Versprechen einer wirklich brauchbaren maschinellen Übersetzung ist so alt wie das der Künstlichen Intellligenz und ähnlich weit von seiner Einlösung entfernt. Ich hatte bereits das Vergnügen, das mit Vergleichstests für Computerzeitschriften wie Chip und PC Intern zu belegen. Die Hersteller von Übersetzungssoftware wurden inzwischen ziemlich kleinlaut und versprechen längst nicht mehr, ihre Programme könnten die Fremdsprachensekretärin ersetzen oder gar das Erlernen einer fremden Sprache ersparen.

Die seriösen Anbieter stellen ihre Programme eher als Werkzeuge dar, die sich beispielsweise durch angepasste Benutzerwörterbücher und die wiederholte Verwendung vorheriger Übersetzungen nützlich machen. Dienlich etwa für EU-Übersetzer, die immer wieder ähnliche Texte in die Sprachen der Mitgliedsländer übersetzen und vor allem auf gleichlautende Begriffe zu achten haben.

„Statistische Massenübersetzung“

Die verlässliche Übersetzung verschiedenster Texte, und dann auch noch gesprochener, ist bis heute die Babelfisch-Fantasie aus Douglas Adams „Per Anhalter durch die Galaxis“ geblieben. Das illustriert anschaulich gerade Googles eigener Dienst „Übersetzer“. Während gängige Übersetzungsprogramme zumindest versuchen, die Grammatik zu analysieren und kontextsensitive Zusammenhänge zu berücksichtigen, setzen die Google-Maschinisten in ihrer grenzenlosen Algorithmengläubigkeit vor allem auf die statistische Auswertung gewaltiger Textmengen, von denen sie sich ein zunehmend besseres Ergebnis erhoffen.

„Statistische Massenübersetzung“ nennen es die Google-Entwickler. Sie speisen bereits mit menschlichem Zutun übersetzte Dokumente in zwei Sprachen ein und verlassen sich drauf, dass Computer die richtigen Muster erkennen, um den üblichen Radebrech der Übersetzungsprogramme zu vermeiden. Der deutsche Entwickler Franz Och, der die Entwicklergruppe für maschinelle Übersetzung im Google-Campus leitet, behauptete schon 2007 deutliche Verbesserungen gegenüber früheren maschinellen Übersetzungsversuchen:

„Als einige Leute, die schon sehr lange mit maschinellen Übersetzungen arbeiten, unsere Ausgabe von Arabisch in Englisch sahen – da haben sie gesagt, das ist erstaunlich, das ist ein Durchbruch.“

Träumt Google von Babelfisch-Androiden?

Inzwischen träumt Och vom echten Babelfisch, dem Android-Handy als Universalübersetzer. Schon in ein paar Jahren soll es soweit sein und die grenzenlose Kommunikation zwischen Menschen ermöglichen, die weltweit in über 6.000 verschiedenen Sprachen parlieren. 52 Sprachen „beherrscht“ Googles automatische Textübersetzung derzeit. Eine Spracherkennung für Android-Geräte setzt bereits aufgenommene Sprache in Texte um, offenbar aber noch wenig treffsicher.

Beide Herangehensweisen möchte Google jetzt in einer Software kombinieren, die einen Anrufer versteht und ihn mit synthetischer Sprachwiedergabe in der gewünschten Zielsprache ausgibt. Mit einer kleinen Wartezeit natürlich, bis der in den Google-Servern beheimatete „Dolmetscher“ die Sprachpakete analysiert hat und sich mit der Übersetzung versucht. Während Linguisten das mit größter Vorsicht einschätzen, glaubt Franz Och ungebrochen an die unaufhaltsame Statistikmethode und sagt den baldigen Durchbruch voraus:

„Wir glauben, dass die Übersetzung von Sprache zu Sprache möglich sein und in ein paar Jahren brauchbare Ergebnisse liefern sollte. Damit es flüssig läuft, brauchen wir natürlich eine Kombination von Maschinenübersetzung mit höchster Genauigkeit und Spracherkennung mit höchster Genauigkeit, und daran arbeiten wir. Wenn Sie sich den Fortschritt in der Maschinenübersetzung und entsprechende Fortschritte in der Spracherkennung ansehen, da gab es in letzter Zeit eine enorme Entwicklung.“

Google Übersetzer, ich heiße nicht Nick Farrell

Diese enormen Fortschritte sind mir jedenfalls entgangen. In den Stats von TecZilla.de fielen mir gelegentliche Abrufe meiner Beiträge in der Google-Übersetzung auf. Die Ergebnisse erscheinen keineswegs besser als das, was die „Volltext-Übersetzungsprogramme“ schon vor rund zehn Jahren brachten. Sie vermitteln eine Ahnung vom Inhalt und erfüllen damit diesen begrenzten Zweck, aber eben nicht mehr.

Im Gegenteil, die rohe Gewalt der statistischen Massenübersetzung erzeugt neue Fehler. Dass ein Name wie „Lange“ in Long übersetzt wird, kam schon länger vor. Der Google-Dienst setzt noch eins drauf und tauschte über Jahr und Tag meinen eigenen Namen aus gegen einen anderen. Bei der Übertragung in andere Spachen – ob in Englisch, Französisch oder Russisch – verwechselte er mich gezielt mit Nick Farrell.

Wie kam das denn? Dafür gibt es eine einfache Erklärung, die viel über die von Och immer wieder behaupteten Fortschritte in der Maschinenübersetzung aussagt. In der Blütezeit des britischen Inquirer (bevor Gründer Mike Magee ausschied) schrieb ich ein paar Jahre für die deutsche Ausgabe (und dort auch schon 2007 über die von Och fast gleichlautend behaupteten Fortschritte).

Die meisten Beiträge (Achtung, Statistik) der deutschen Ausgabe kamen von mir, die meisten englischsprachigen bei Inquirer UK von Nick Farrell. Obwohl regelmäßig nicht nur Übersetzungen, ging es oft um die gleichen Inhalte, verbunden mit identischen Links zu weiteren Quellen. Die Algorithmen für Googles statistische Massenübersetzung schlossen daraus messerscharf „Bernd Kling = Nick Farrell“ und nahmen mir meine Identität.

Sie sind aber lernfähig, wenn auch mit einer gewissen zeitlichen Verzögerung. Seit kurzem belässt mir Googles Übersetzungsdienst meinen Namen auch in anderen Sprachen. Vermutlich wieder ein statistischer Effekt, nach rund tausend Beiträgen in meinen eigenen Publikationen.

Kein Babelfisch in Sicht

Da ich in früheren Jahren als Übersetzer ohne maschinelle Hilfsmittel rund 10.000 Seiten (Science-Fiction-Romane und mehr) aus dem Englischen zu übertragen hatte, lasse ich mir gerne Befangenheit unterstellen, wenn ich meine Skepsis zu diesen Google-Träumen anmelde. Auch wenn die Google-Entwickler nie vom festen Glauben an ihre Algorithmen abfallen werden: Der noch so massive Einsatz statistischer Massenübersetzungen schafft nicht das Android-Smartphone als Universalübersetzer.

(bk)

Montage: TecZilla / Screenshots: TecZilla / Google Übersetzer

Diese Icons verlinken auf Bookmark Dienste bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • Facebook
  • Google Bookmarks
  • TwitThis