2009/06/24

Wörterreihenautomaten I


Seit einiger Zeit lassen sich Computerprogramme im Netz finden, die vortäuschen sollen, daß man mit ihnen beliebige Texte aus einer natürlichen Sprache in eine andere übersetzen könne. Übersetzungen aus einer natürlichen Sprache in eine andere kann selbstverständlich kein Computerprogramm leisten. Was machen die fraglichen Computerprogramme wirklich? Es sind Automaten, die bedeutungslose Reihen aus relativ wahllosen Wörtern bilden. Es handelt sich dabei nicht um richtige Sätze, denn weder Satzbau noch Zeichensetzung noch Grammatik der Zielsprachen werden berücksichtigt. Anders als Sprachlehrer gerne behaupten, lassen natürliche Sprachen es auch zu, sich ohne vollständige Sätze verständlich auszudrücken. Solche Ausdrucksweisen benennen Sprachwissenschaftler dann gerne als Satzfragmente. Aber auch solche Satzfragmente produzieren die fraglichen Computerprogramme nicht. Deswegen wäre es falsch zu behaupten, daß Worte das Resultat der Computerprogramme sind. Worte enthielten einen Sinn. Die Wörterreihen tun das nicht. Man sollte solche Computerprogramme auch nicht als Reihungsautomaten bezeichnen, denn das klingt danach als wäre in den Wörterreihen zumindest so viel Struktur wie in einer mathematischen Zahlenreihe. Das ist aber ebenfalls nicht der Fall. Die Wörter werden durch den Automaten nicht sortiert, sondern lediglich in einer mehr oder weniger zufälligen Abfolge aneinandergereiht. Statt durch computergenerierte Zufallszahlen wird die Abfolge der Wörter in der Zielsprache durch die Wörter aus dem quellsprachlichen Text bestimmt. Dadurch dürfte die Abfolge der zielsprachlichen Wörter noch zufälliger sein als das durch computergenerierte Zufallszahlen überhaupt möglich wäre. Computergenerierte Zufallszahlen sehen nämlich lediglich zufällig aus, sind aber vorhersehbar, sobald der Algorithmus des dazu verwendeten Computerprogrammes durchschaut wurde. Die fraglichen Computerprogramme können also lediglich als Wörterreihenautomaten korrekt bezeichnet werden.

Ein Wörterreihenautomat geht den quellsprachlichen Text Wort für Wort durch und ersetzt das jeweilige Wort durch ein zielsprachliches Wort. Dabei verwendet der Automat immer das Wort, das in einem Wörterbuch als erster Eintrag verzeichnet wäre. Ein Wörterreihenautomat besitzt also ein eingebautes, kleines Wörterbuch, das nicht sehr in die Tiefe geht. Schon die geringe Auswahlmöglichkeit sorgt dafür, daß eine richtige Übersetzung nicht möglich ist. Bei besseren Wörterreihenautomaten geht das eingebaute Wörterbuch dafür sehr in die Breite, so daß kaum noch ein Wort einfach in der Quellsprache stehenbleibt. Bessere Wörterreihenautomaten kommen sogar mit den häufigsten grammatischen Formen, die in der Quellsprache auftreten können zurecht. Die zielsprachlichen Wörter in eine passende grammatische Form zu bringen funktioniert dagegen meistens nicht, weil den Wörterreihenautomaten die wichtigste Voraussetzung fehlt, die erforderlich wäre, um einen Text wirklich zu übersetzen. Die wichtigste Voraussetzung ist nämlich den zu übersetzenden Text tatsächlich zu verstehen. Das kann kein Computerprogramm leisten. Bessere Wörterreihenautomaten enthalten Wörterbücher für sehr viele Sprachen. Zwar sind die eingebauten Wörterbücher nicht sehr leistungsfähig, aber es gibt für viele Sprachkombinationen garkeine anderen Wörterbücher. Deswegen wäre es sehr nützlich, wenn man die eingebauten Wörterbücher vom übrigen Programm getrennt verwendet werden könnten. Aber das ist mit den bisher existierenden Wörterreihenautomaten leider nicht möglich. Die schlechtesten unter den Wörterreihenautomaten geben vor, mehr Sprachkombinationen zu kennen als sie das tatsächlich tun. Im Fall, daß ihnen so eine zusätzliche Sprachkombination abverlangt wird, erstellen sie intern zunächst eine Wörterreihe aus Wörtern des angelsächsischen Dialektes des Niederdeutschen, dann verwenden sie diese Wörterreihe um daraus eine Wörterreihe der Zielsprache zu erstellen. Teilweise bleiben in der am Ende produzierten Wörterreihe sogar noch angelsächsische Wörter stehen. Spätestens der Umweg über den Hinterwäldlerdialekt macht auch eine teilweise Übertragung des Sinns eines Textes von einer Kultursprache in eine andere völlig unmöglich.

Keine Kommentare:

Kommentar veröffentlichen