Stepmex Weblog: Auszug: Praktische Anwendung maschineller Textverarbeitung in der Computerlinguistik

Hiermit möchte ich mit einem kurzen Auszug aus meiner Studien-Abschlussarbeit ein Thema darstellen, das gleichermaßen populär ist und trotzdem noch viele Probleme aufwirft. Die Entwicklung steckt sozusagen noch in den Kinderschuhen und hat noch sehr viel Potential für Verbesserungen.

Viel Spaß beim Lesen!

2.3.8 Probleme der Maschinellen Übersetzung

Die Maschinelle Übersetzung ist im Grunde eine technische Abbildung eines hochkomplexen Vorgangs. Es wird versucht, Prozesse, die sich aus der Zusammenarbeit zwischen Gehirn und Bewusstsein ergeben, auf ein strukturelles Modell zu reduzieren. Die Erwartungshaltung der Menschheit ist derart hoch, dass der Wissenschaft die Realisierung dieses Menschheitstraums grundsätzlich zugetraut wird. Dagegen ist den wenigsten Personen die tatsächliche Problemstellung dieser Thematik deutlich genug, um festzustellen, dass das ein in absehbarer Zeit unmögliches Vorhaben darstellt.
Für ein solches System, das nach dem FAHQT-Anspruch Ergebnisse liefern soll, wird ein umfassendes, vollständiges und detailliertes Wissen der natürlichen Sprache vorausgesetzt. Ein vollständiges Begreifen der menschlichen Sprache bedeutet jedoch das vollständige Begreifen der menschlichen Intelligenz. Daraus lässt sich ableiten, dass ein „Fully Automatic High Quality Translation“-System den menschlichen Geist simulieren können muss und damit eine Künstliche Intelligenz darstellen würde. Sollte die Entwicklung der Maschinellen Übersetzung jemals so weit voranschreiten, dass dieser Ansatz darin Verwendung finden würde, kann von einem perfekten MÜ-System gesprochen werden.

Da der tatsächliche Fortschritt in der Forschung für solche Entwicklungen bei weitem noch nicht ausreicht, müssen Methoden eingesetzt werden, die solche Probleme umgehen können. Ein Lösungsansatz wird bereits durch die statistische Maschinelle Übersetzung (SBMT) dargestellt, da sich die Regeln aus den übersetzten Texten ergeben. Eine Intelligenz ist jedoch nicht feststellbar (und bei dieser Methode auch nicht vorgesehen).

Die Schwierigkeiten der Maschinellen Übersetzung bestehen deshalb darin, komplexe, mentale Prozeduren des Gehirns, die natürliche Sprache zum Ausdruck bringen können und unendlich viele Informationen beinhalten, zunächst auf eine endliche Menge zu reduzieren, um dann ein technisches Verfahren zu entwickeln.

Die Informationen, die berücksichtigt werden müssen, um ein Übersetzungssystem zu entwickeln, müssen von der linguistischen Theorie erfasst werden. Um Informationen auswerten zu können, müssen wichtige und wesentliche Informationen von unwichtigen Informationen unterschieden werden. Außerdem kommt es bei der Verarbeitung natürlicher Sprache immer auf das (Fach-)Wissen der Humanquelle an, es kann sich um einen normalen Zeitungsartikel handeln oder um einen Bericht in einer Fachzeitschrift. In beiden Fällen ist das zugrunde liegende Vokabular ein Anderes, die Transferregeln von einer Sprache in die Andere können je nach Übersetzungsverfahren stark variieren. Eine weitere, große Problemquelle der Maschinellen Übersetzung ist die Erkennung von Kontexten, die situationsabhängig sind. So werden Mehrdeutigkeiten von Wörtern nicht intelligent erkannt, sondern meist nur statistisch bewertet.

Stepmex Weblog

Donnerstag, 1. Oktober 2009

Auszug: Praktische Anwendung maschineller Textverarbeitung in der Computerlinguistik

Keine Kommentare:

Kommentar veröffentlichen