Übersetzung - iks.hs-merseburg.deuheuert/pdf/Anwendung Rechnernetze/Vortraege... · Programm...
Transcript of Übersetzung - iks.hs-merseburg.deuheuert/pdf/Anwendung Rechnernetze/Vortraege... · Programm...
Übersetzung
»Übersetzen ist ein schwieriges Problem. Computer besitzen nun mal keinerlei Intelligenz. Ein Mensch kann eine Sprache schon mit tausend Wörtern sprechen. Wir haben Computermodelle mit über einer Million Wörtern - und trotzdem können sie nicht mit einem Menschen mithalten.«
(Systran-Chef Dimitris Sabatakakis )
Alexander Brunsbach Anwendung Rechnernetze
0. Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 2
1. Wozu maschinelle Übersetzung?
� viele Texte sind digital verfügbar � einfache Übersetzung möglich
� Globalisierung
� Wirtschaftlich wichtige, schwer erlernbare Sprachen� Wirtschaftlich wichtige, schwer erlernbare Sprachen� chinesisch, japanisch, koreanisch, usw.
� Militärisch wichtige, schwer erlernbare Sprachen� arabisch, paschtu, usw.
06.12.2007 Alexander Brunsbach 3
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 4
2. Idee
� Verstehen einer Sprache, ohne sie selbst zu beherrschen
� Erfordert� Künstliche Intelligenz� Künstliche Intelligenz
� Computerlinguistik
� Mathematik
� Informatik
06.12.2007 Alexander Brunsbach 5
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 6
3. Geschichte
� Erstes große Projekt vom US-Militär� Russisch-Englisch-Übersetzungsprogramm
� 1966: Pentagon bescheinigt grundsätzliche Unrealisierbarkeit der maschinellen ÜbersetzungUnrealisierbarkeit der maschinellen Übersetzung
� 1980: Siemens AG greift MÜ – Forschung wieder auf
� 1980er: Japan entwickelt erstes kommerzielle MÜ –Programm (in Prolog)
06.12.2007 Alexander Brunsbach 7
3. Geschichte
� 1990er: „Verbmobil“ wird von deutscher Industrie und Akademik entwickelt (Spracherkennung, Direktübersetzung, Satzgenerierung)
� 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen � 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen melden Konkurs an
� 2007: nur 1% des Gesamtumsatzes auf dem Übersetzungsmarkt durch MÜ
„Die maschinelle Übersetzung befindet sich in Kinderschuhen“
(google)
06.12.2007 Alexander Brunsbach 8
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 9
4. Übersetzungsmethoden
� Datei / Datenbank mit „Vokabel-“ Einträgen
� Direkte MÜ� Wort-für-Wort-Übersetzung
� Anschließende Satzgenierung� Anschließende Satzgenierung
� Robust und schnell
06.12.2007 Alexander Brunsbach 10
Quelltext Morphologische Analyse
Wortstellungs-korrektur
ZieltextBilinguales Wörterbuch
4. Übersetzungsmethoden
� Transfer� Satzanalyse (Baumstruktur)
� Transfer (Übersetzung)
� Generierung (Satzbildung nach grammatikalischen � Generierung (Satzbildung nach grammatikalischen Regeln der Zielsprache)
06.12.2007 Alexander Brunsbach 11
Quelltext Analyse Transfer Generierung Zieltext
4. Übersetzungsmethoden
� Interlingua� Grammatische Information der Quellsprache, wird in
neutraler Zwischensprache ausgedrückt
� Erzeugung grammatischer Information der � Erzeugung grammatischer Information der Zielsprache
� „einfache“ Übersetzung komplexer Ausdrücke
06.12.2007 Alexander Brunsbach 12
Quelltext Analyse Generierung Zieltext
4. Übersetzungsmethoden
� Example-Based Machine Translation (EBMT)� Speicherung von häufig vorkommenden Sätzen
� Ableitung ähnlicher Sätze
� Statistics-Based Machine Translation (SBMT)� Statistics-Based Machine Translation (SBMT)� Einlesen von zweisprachigem Textfundus
� Vergleich mit Quelltext
06.12.2007 Alexander Brunsbach 13
4. Übersetzungsmethoden
� Human-Aided Machine Translation (HAMT) � Programm fordert Benutzer zur Teilübersetzung auf
Die meisten Systeme in der Praxis sind eine Mischung aus
mehreren Methoden (oft Dominanz des Transfersystems mit
Interlingua und EBMT-Elementen)
06.12.2007 Alexander Brunsbach 14
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 16
5. Übersetzungsprogramme
� Systran übersetzt täglich 30 Millionen Web-Seiten
06.12.2007 Alexander Brunsbach 17
5. Übersetzungsprogramme
Test diverser, freier Übersetzungstools, anhand des Beispielsatzes:anhand des Beispielsatzes:
„John lässt sich einen Bart wachsen“
Deutsch → Englisch → Deutsch
06.12.2007 Alexander Brunsbach 18
5. Übersetzungsprogramme
� Google überzeugt beim Wettbewerb automatischer Dolmetscher� Google verzichtet auf linguistische Regeln und setzt
auf Statistikauf Statistik
� 1000 Rechner mit einem Sprachschatz von 200 Milliarden Wörtern
� »das größte Sprachmodell in der Geschichte der Menschheit« (Franz Och)
06.12.2007 Alexander Brunsbach 23
5. Übersetzungsprogramme
� Beispielübersetzung einer arabischen Zeitungsschlagzeile� Google: »ElBaradei: Inspektoren brauchen ›einige
Monate‹, um ihre Aufgabe zu erfüllen«,Monate‹, um ihre Aufgabe zu erfüllen«,
� Systran: »Der Bradi: Die Inspektoren brauchen zu ›einige Monate‹ für Ende wichtige ihr.«
»Die Infrastruktur ist fantastisch. Hier werden acht
Milliarden Web-Seiten erfasst und ständig
aktualisiert. Die liegen einfach da, und mit denen
kann man dann rechnen.« Franz Och (google)
06.12.2007 Alexander Brunsbach 24
5.1 Verbmobil
� Sprachübersetzung für deutsch, englisch und japanisch
� Sprecherunabhängig
� „Echtzeit“ – Berechnung� „Echtzeit“ – Berechnung
� Beschränkung auf� Terminabsprache
� Reiseplanung
� Hotelreservierung
� Forschungsgelder von 170 000 000 DM
06.12.2007 Alexander Brunsbach 25
5.1 Verbmobil
� Gleichzeitige Anwendung von fünf Übersetzungsverfahren
� Über stochastisches Verfahren, wird die wahrscheinlichste Übersetzung gewähltwahrscheinlichste Übersetzung gewählt
� Wortschatz von 10 000 Wörtern
� Umgang mit „Spontansprache“� „Ja, ich weil also würde mal sagen äh vorschlagen,
wir könnten uns am äh 7. treffen so im Mai“
� „How about the seventh of May?“
06.12.2007 Alexander Brunsbach 27
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 29
6. Statistics-Based Machine Translation
� Statistischer Ansatz� Maschinelle Sprachverarbeitung = statistische
Entscheidungstheorie + linguistische Modellierung
� 1989-1994: IBM forscht an statistischen � 1989-1994: IBM forscht an statistischen Übersetzungsmethoden, als Textfundus dienten die kanadischen Parlamentsaufzeichnungen
(bilingual: englisch – französisch)
06.12.2007 Alexander Brunsbach 30
6. Statistics-Based Machine Translation
� Language Modell: syntaktische / semantische Struktur der möglichen Sätze der Zielsprache
� Übersetzungsmodell: Zusammenhang zwischen Quell –und Zielsatz
06.12.2007 Alexander Brunsbach 31
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 32
7. Fazit
� Heutige maschinelle Übersetzungssysteme sind sehr unvollkommen
� Abstraktionsfähigkeit ist beschränkt
� „Gesprochene und geschriebene Sprache hat es � „Gesprochene und geschriebene Sprache hat es schon gegeben, lange bevor es Grammatiker, Linguisten und Informatiker gab.“
06.12.2007 Alexander Brunsbach 34
Quellen
� Grundlagen der Computerlinguistik (Roland Hausser)
� Computerlinguistik und Sprachtechnologie (K.-U. Carstensen)
� http://zeus.zeit.de/text/zeit-wissen/2006/03/Maschinelle_Uebersetzung.xml
� http://www.ifi.unizh.ch/groups/ailab/teaching/semi2000/sprachverarbeitung.pdf
� Informatik – Spektrum (Mai 2003)Informatik – Spektrum (Mai 2003)
� http://server02.is.uni-sb.de/courses/wiki/index.php/Maschinelle_%C3%9Cbersetzung
� http://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung
� http://server02.is.uni-sb.de/courses/wiki/index.php/Verbmobil
06.12.2007 Alexander Brunsbach 35