Europäischer Erfinderpreis

Lasst Zahlen sprechen

Philipp Koehn

Philipp Köhn, Daniel Marcu, Kevin Knight und William Wong, Erfinder einer modernen Methode für die automatisierte maschinelle Übersetzung

Vielleicht ist die heutige Übersetzungssoftware nicht ganz so nützlich wie C-3PO, der zuverlässige Droide aus Star Wars, der fließend 6 Millionen Sprachen spricht. Doch dank dem deutschen Informatiker Philipp Köhn sind wir dem Traum, Übersetzungen mithilfe künstlicher Intelligenz anzufertigen, sehr viel näher als einer weit entfernten Galaxie.

Krisengespräche

Statistische maschinelle Übersetzungen, oder die sofortige Umwandlung von Text aus einer Sprache in eine andere per Computer, wurden zur Zeit des Kalten Krieges entwickelt. Amerikanische Wissenschafter mussten russische Texte so schnell wie möglich dechiffrieren, um ihrem Feind stets einen Schritt voraus zu sein.

Die Geschwindigkeit stellte jedoch ein Problem dar. Die Computer waren nicht schneller als echte Dolmetscher. Häufig waren auch die Ergebnisse kaum zu verstehen, da jede Grammatikregel von Hand codiert werden musste.

Ein Durchbruch in der maschinellen Übersetzung ließ bis in die späten1980er, kurz vor dem Zusammenbruch der Sowjetunion, auf sich warten. Eine Gruppe von Forschern bei IBM hatte erkannt, dass es viel zu viel Aufwand war, einem Computer das Vokabular und die verwirrenden Grammatikregeln einer neuen Sprache zu erklären. Viel effizienter war es, dem Computer das eigenständige Lernen beizubringen.

„Die Verarbeitung natürlicher Sprache ist immer mit Problemen verbunden. Deshalb funktionieren die einfachsten Methoden am besten.“

Weltweite Bekanntheit

In der Schule lernen Kinder, Sätze Wort für Wort zu analysieren. Die Technik der Forscher schlug hingegen einen neuen Weg ein und beinhaltete Algorithmen, über die der aus statistischer Sicht beste Treffer für einzelne Wörter gefunden wurde. Die Algorithmen stützten sich darauf, wie häufig die Wörter in bereits vorhandenen Übersetzungspaaren vorkamen.

Das Ergebnis war ähnlich, als hätte man Schülern gleich die Ergebnisse zu einem Englischtest verraten, anstatt ihnen Wörterbücher zu geben und die Syntax beizubringen.

„Die Verarbeitung natürlicher Sprache ist immer mit Problemen verbunden. Deshalb funktionieren die einfachsten Methoden am besten", erklärt Philipp Köhn, der an der University of Edinburgh in Schottland als Experte für maschinelle Übersetzung tätig ist.

Köhn beschäftigt sich seit 1997 mit maschineller Übersetzung und gilt mittlerweile als Koryphäe auf dem Gebiet der computergestützten Übersetzung: Binnen Sekunden kann er mithilfe eines Computers Textstücke in 64 Sprachen übersetzen.

Babylonisches Problem, moderne Lösung

Vor Philipp Köhn konnten Modelle für die maschinelle Übersetzung ihr Potenzial nicht einmal annähernd ausschöpfen. Schwerfällige Algorithmen suchten in Originaltexten Wort für Wort nach Parallelen und waren dabei deutlich langsamer, als sie hätten sein müssen.

„Computern das eigenständige Lernen beizubringen hat mich schon immer fasziniert. Die besondere Herausforderung liegt darin, dass sie wirklich verstehen müssen, wie wir Sprache verwenden", erläutert Köhn.

2003 erhielt Köhn seinen Doktortitel von der University of Southern California. Anschließend meldete er zusammen mit seinen Professoren Daniel Marcu und Kevin Knight ein Stammpatent zu statistischer maschineller Übersetzung an.

Er bezeichnete seine Methode als phrasenbasierte maschinelle Übersetzung. Später beschrieb er als Mitherausgeber in einer Arbeit, wie Modelle für die phrasenbasierte statistische maschinelle Übersetzung wortbasierte Modelle übertreffen, da sie effizientere und genauere Ergebnisse liefern.

„Die Nachfrage nach ‚unvollkommenen‘ Übersetzungen ist weltweit riesig. Häufig wird nur eine schnelle Übersetzung benötigt, um den allgemeinen Inhalt eines Textes zu verstehen.“

Voraussetzung: Internetzugang

Im Gegensatz zur früheren wortbasierten Übersetzung werden bei der phrasenbasierten Übersetzung ganze Wortfolgen statt einzelner Wörter betrachtet, wodurch zahlreiche Einschränkungen wegfallen. Während ein Wort mehrere mögliche Bedeutungen haben kann (leider verstehen Computer keinen Kontext), ist die Bedeutung von Phrasen in der Regel eindeutig.

Dieses Konzept erregte unter den Fachleuten für maschinelle Übersetzung große Aufmerksamkeit. Heute haben die meisten wichtigen Unternehmen im Bereich der Internetübersetzung, einschließlich Google und Microsoft, das neue Modell integriert.

Auch wenn Köhn nie direkt mit Google zusammengearbeitet hat, ist ein Großteil seiner Forschungsarbeit in den Online-Übersetzungsdienst des Hightech-Giganten eingeflossen. „Die Nachfrage nach ‚unvollkommenen‘ Übersetzungen ist weltweit riesig", legt Köhn dar. „Häufig wird nur eine schnelle Übersetzung benötigt, um den allgemeinen Inhalt eines Textes zu verstehen."

Moses der Allmächtige

Von seinem Büro an der University of Edinburgh unterhält Köhn die Open-Source-Plattform Moses für die maschinelle Übersetzung. Im Wesentlichen handelt es sich hierbei um eine abgespeckte Version des Systems, das Google verwendet.

Im Gegensatz zu Universal-Übersetzungsdiensten wie denen von Google und Bing können Systeme, die auf Moses basieren, auf benutzerspezifische und domainspezifische Daten spezialisiert werden. Das führt zu einer erhöhten Übersetzungsqualität.

Jeden Monat zählt die Moses-Website 20.000 Seitenaufrufe. Große Unternehmen wie Sony und Adobe nutzen die Seite zur Lokalisierung von Dokumenten und Websites, damit all ihre Kunden weltweit ihre Handbücher lesen oder ihre Software korrekt installieren können.

Dank Köhns Erfindung sind auch mehrsprachige Nachrichtenüberblicke oder ähnliche Anwendungen möglich. Dienste wie der Europe Media Monitor der Europäischen Union übersetzen jeden Tag Tausende von Artikeln zu Analyse- und Berichterstattungszwecken in 50 verschiedene Sprachen.

„Computern das eigenständige Lernen beizubringen hat mich schon immer fasziniert. Die besondere Herausforderung liegt darin, dass sie wirklich verstehen müssen, wie wir Sprache verwenden.“

Köhn spricht auch Ihre Sprache

Rund um Köhns Erfindung ist bereits ein lukrativer Markt mit einem Wert von knapp 600 Mio. USD entstanden (Stand 2010). Köhn rechnet damit, dass dieser Markt weiter expandiert und seine Technologie letztendlich Übersetzungsexperten in diesem Bereich unterstützt.

Er erläutert: „Die Technologie soll Menschen, also professionelle Übersetzer, bei ihrer Arbeit unterstützen. In den kommenden Jahren werden wir außerdem die Kosten und den Zeitaufwand der menschlichen Übersetzung erheblich senken können, wenn die Übersetzungsqualität steigt und die Fehlerquote sinkt."

Die wirtschaftlichen Auswirkungen dieses Durchbruchs können nicht genau beziffert werden. Auf den Märkten für Sprach- und Übersetzungssoftware werden jedoch jedes Jahr Millionen von Dollar investiert (voraussichtlich 3 Mrd. USD im Jahr 2017). Sowohl exportorientierte multinationale Konzerne als auch internationale Organisationen nutzen maschinelle Übersetzungen.

Mit ihrer revolutionären Herangehensweise haben Köhn und sein Team jedem das Tor zu einer multilingualen Welt mit Sinngehalt geöffnet - es ist lediglich ein Internetzugang notwendig.


Funktionsweise

Ein wortbasiertes Übersetzungsmodell, der Vorläufer zum phrasenbasierten Modell, teilt einen Satz in einzelne Wörter auf und übersetzt diese voneinander losgelöst in die Zielsprache. Anschließend werden die Wörter neu angeordnet, und der Zielsatz verfügt zumindest dem Anschein nach über eine kohärente Syntax.

Die neue Anordnung folgt einem Lernprozess: Es wird nachvollzogen, welche Wörter zusammengehören, wenn von a nach b oder umgekehrt übersetzt wird. Dabei ist, wie bei Kindern in der Grundschule, das Einprägen von Mustern hilfreich. Werden die beiden Datensätze miteinander verglichen, kann der Computer eine begründete Vermutung zur Reihenfolge der endgültigen Übersetzung anstellen.

Es gibt allerdings einen Nachteil: Die Anzahl der eingegebenen Wörter stimmt immer mit der Anzahl der ausgegebenen Wörter überein. Das führt häufig zu einem überflüssigen und überladenen Sprachgewirr.

Die phrasenbasierte Übersetzung optimiert diesen Prozess. Philipp Köhn lässt seinen Computer nicht mehr jedes Wort einzeln übersetzen, um die Wörter dann zu einem Satz zusammenzukleben. Stattdessen hat er ihn so programmiert, dass Wortgruppen (Phrasen) verarbeitet werden, für die nach Übersetzungen gesucht wird.

Ein wortbasiertes Modell würde beispielsweise den englischen Satz „It rains cats and dogs" in einzelne Wörter aufteilen und diese übersetzen („It", „rains", „cats", „and", „dogs"), um sie anschließend zum Zielsatz „Es regnet Katzen und Hunde" anzuordnen.

Ein phrasenbasiertes Modell übersetzt ganze Phrasen aus mehreren Wörtern, wie „It rains" und „cats and dogs". Damit sind weniger Schritte bis zum Endergebnis "Es regnet wie aus Kübeln" notwendig - das spart nicht nur Zeit, sondern führt auch zu korrekteren Übersetzungen.

Was heißt „innovativ" auf Estnisch?

Das Europäische Patentamt hat sich einer wachsenden Gruppe multinationaler Organisationen angeschlossen, darunter die Europäische Union und die Welthandelsorganisation, die sich auf die phrasenbasierte Übersetzung stützen, um große mehrsprachige Gemeinschaften miteinander zu verbinden.

Der Übersetzungsdienst „PatentTranslate" des EPA wurde Anfang 2012 im Rahmen einer Partnerschaft mit Google entwickelt. Mit PatentTranslate können Unternehmen und Erfinder recherchieren, ob eine neue Erfindung tatsächlich einzigartig ist, oder ob sie bereits von einem anderen Erfinder entworfen wurde, der eine andere Sprache spricht.

Der Onlinedienst vereinfacht die bislang zeitaufwendige und kostenintensive Recherche. Derzeit werden Übersetzungen in vierzehn europäische Sprachen sowie Chinesisch angeboten; damit sind rund 90 % aller in Europa erteilten Patente abgedeckt. Bis Ende 2014 sollen alle 28 Sprachen der Mitgliedstaaten des EPA sowie Japanisch, Koreanisch und Russisch berücksichtigt werden.

Da die Übersetzungstechnologie von Google „mitlernt", kann sie sich an die für Patente typische hochtechnische Sprache anpassen. Je mehr Patentdokumente und Sprachen hinzukommen, desto höher wird die Übersetzungsgenauigkeit.

Maschinelle Übersetzung - jetzt auch in Ihrer Nähe

Die Popularisierung der Simultanübersetzungstechnologie liegt vor uns. In den letzten Monaten versetzten mit Spannung erwartete Lösungen für das Dolmetschen, die wie aus einem Science-Fiction-Roman gegriffen schienen, die Welt in große Aufregung.

Die erste Lösung ist ein System des Londoner Erfinders Will Powell, das als Dolmetscher zwischen Englisch- und Spanischsprechenden dient. Jeder Sprecher nutzt ein Headset, das mit einem Mobiltelefon verbunden ist. Auf den Gläsern speziell angefertigter Brillen erscheint die Übersetzung in Form von Untertiteln.

Die zweite Lösung ist ein Dienst von NTT DOCOMO, einem großen japanischen Mobilfunkanbieter, mit dem Telefongespräche vom Japanischen in drei andere Sprachen und umgekehrt gedolmetscht werden können. Der Dienst wurde letzten November eingeführt. Dabei wird eine Seite des Gesprächs aufgenommen, die Daten werden innerhalb kürzester Zeit verarbeitet, und das Ergebnis wird dem anderen Gesprächsteilnehmer wahlweise in einer Frauen- oder Männerstimme vorgelesen.

Die dritte Erfindung wurde letzten Oktober auf einer Konferenz in China vorgestellt. Rick Rashid, Chef von Microsoft Research, hielt dort einen Vortrag in englischer Sprache, der sofort in Mandarin übersetzt und als Untertitel auf einer Leinwand angezeigt wurde. Direkt im Anschluss daran las eine Computerstimme Rashids Vortrag laut vor, einschließlich passender Intonation.

„Die Technologie soll Menschen, also professionelle Übersetzer, bei ihrer Arbeit unterstützen. In den kommenden Jahren werden wir außerdem die Kosten und den Zeitaufwand der menschlichen Übersetzung erheblich senken können.“

Quick Navigation