Maschinelle Übersetzung / Machine Translation
Wann und wie wird die maschinelle Übersetzung eingesetzt?
Maschinelle Übersetzungen gibt es schon seit vielen Jahren. Sie sind jedoch erst in jüngster Zeit bekannter geworden, was vor allem an der steigenden Qualität der übersetzten Texte liegt.
Die maschinelle Übersetzung hat die nächste Entwicklungsstufe erreicht – die früheren statistischen (SMT – Statistical Machine Translation) Modelle werden durch neuronale (NMT - Neural Machine Translation) ersetzt. Einfach gesagt – die maschinellen Übersetzer haben begonnen zu lernen. Nicht nur aus den Daten, die wir ihnen liefern, sondern auch aus ihren eigenen Fehlern.
Aber dieser scheinbar kleine Schritt ist ein großer Schritt für die Qualität des fertig übersetzten Textes.
Allerdings gilt nach wie vor, dass es keinen Ersatz für menschliche Übersetzungen gibt – dies bedeutet also nicht das Ende von Übersetzern oder Übersetzungsbüros. Es ist nur so, dass sich die Übersetzungsarbeit verändert, bzw. die mit der Übersetzung verbundenen Dienstleistungen.
Aspena verwendet für Kunden, die an maschineller Übersetzung interessiert sind, hauptsächlich zwei maschinelle Übersetzer – DeepL und Google Cloud Translate.
Jeder ist für etwas anderes geeignet – DeepL bietet zwar im Vergleich zu Google eine begrenzte Anzahl von Sprachen, ist langsamer, weist jedoch oft eine bessere Qualität der resultierenden Übersetzung auf.
Andere maschinelle Übersetzer, mit denen wir arbeiten, sind KantanMT, Omniscien, Amazon MT und Tilde MT.
Hier kommen wir zu der grundsätzlichen Frage – wann und wie man die maschinelle Übersetzung einsetzt.
Wie bereits erwähnt, kann die menschliche Übersetzung nicht durch eine maschinelle Übersetzung ersetzt werden. Es gibt jedoch Fälle, in denen der Einsatz von maschineller Übersetzung sinnvoll sein kann – zum Beispiel zum internen Bekanntmachen mit einen Text in einer Fremdsprache oder zum Testen einer mehrsprachigen Umgebung beim Schreiben von Software oder Anwendungen.
Schauen wir uns die Grundübersetzung an. Sie ist definiert als die Übertragung von einer natürlichen Sprache in eine andere, wobei die Bedeutung erhalten bleibt.
Nach der Übersetzung durch einen menschlichen Übersetzer haben Sie einen Text, dessen Bedeutung Sie auch ohne Kenntnisse der Ausgangssprache verstehen können.
Wenn Sie eine maschinelle Übersetzung verwenden, erhalten Sie einen Text, der vereinfacht wie folgt beschrieben werden kann:
- große Teile werden Sie auch verstehen (wie viel, hängt vom verwendeten Übersetzer, der Sprachkombination, dem Ausgangstext, dem Trainingsmaß des Übersetzers ab),
- ein Teil des Textes wird eher für jemanden verständlich sein, der die Ausgangssprache kennt (und errät, wie die Maschine es "meinte", als sie den Text übersetzt hat),
- Ein Teil des Textes ergibt möglicherweise keinen Sinn.
Es ist noch gar nicht so lange her, dass unverständliche (ja unsinnige) Teile nach der maschinellen Übersetzung in der Größenordnung von mehreren Dutzend Prozent des gesamten Textumfangs lagen. Dies ändert sich schnell, und zwar gerade dank des Einsatzes von neuronalen Netzwerken und Deep Learning.
Es ist jedoch gefährlich, sich darauf zu verlassen, dass maschinell übersetzte Dokumente für 100 % Klarheit sorgen.
Maschinelle Übersetzungen ohne weitere Bearbeitung sind für eine Veröffentlichung nicht geeignet. Dies wird erst durch einen nächsten Schritt unter Einbeziehung eines menschlichen Übersetzers gewährleistet; nämlich durch das Machine Translation Post-Editing (MTPE).
Aspena bietet zwei Nachbearbeitungsoptionen an:
Light Post-Editing – Überarbeitung des Textes durch einen menschlichen Übersetzer, deren Ziel es ist, nur die notwendigsten Korrekturen am Text vorzunehmen, damit das Ergebnis als Ganzes für den Endbenutzer verständlich ist – dieses grundlegende Post-Editing befasst sich nicht mit der Stilistik, es geht nicht um bevorzugte Änderungen. Es ist nicht der Zweck, eine Übersetzung zu liefern, die mit einer menschlichen Übersetzung vergleichbar ist. Diese Nachbearbeitung wird hauptsächlich für dringende interne Übersetzungen verwendet.
Full Post-Editing – eine tiefere Überarbeitung des Textes, um eine mit der menschlichen Übersetzung vergleichbare Qualität zu erreichen. Dies kann bedeuten, dass der Übersetzer einige Teile erneut übersetzt und den maschinell übersetzten Text ignoriert.
Aus unserer Sicht ist die maschinelle Übersetzung eine der Dienstleistungen in unserem Portfolio – sie ist kein Ersatz für die traditionelle Übersetzung.
Es ist wichtig zu beachten, dass nicht alle Dokumente für eine maschinelle Übersetzung geeignet sind. Dies sind hauptsächlich Dokumente, die kreative Texte, bestimmte Ausdrucksweisen (Ironie, Witze, poetische Wendungen usw.) enthalten.
Andererseits sind technische, stereotype, standardisierte Texte dafür geeignet.
Es ist erwähnenswert, dass auch ein Text, der ursprünglich nicht für eine maschinelle Übersetzung geeignet ist, zu einem gut übersetzten Text werden kann. Es kommt auf die richtige Kombination aus maschinellem Übersetzer und menschlichem Übersetzer an.
Ebenso wichtig ist die Überlegung, ob der Kunde die maschinelle Übersetzung selbst erstellen oder an ein Übersetzungsbüro vergeben soll.
DeepL und Google bieten ebenfalls Übersetzungen durch Kopieren von Texten in eine Weboberfläche und anschließendes Zurückkopieren in das Dokument an. Dies kann mühsam und langwierig sein und die Formatierung bleibt nicht erhalten.
Im Gegensatz zu Google bietet DeepL auch Übersetzungen ganzer Dateien an (derzeit nur MS Word und PowerPoint), allerdings ist bei der kostenlosen Variante die Anzahl und Größe der Dokumente begrenzt (3 Dokumente pro Monat). Auch bei den kostenpflichtigen Versionen ist die Anzahl der Dokumente und ihr Umfang begrenzt.
Der Ordnung halber sei auch erwähnt, dass Google Übersetzungen von grundlegenden Dokumenten in seiner Web-App Google Docs anbietet.
DeepL bietet auch eine Desktop-Anwendung für Windows und Mac, die die Arbeit etwas vereinfacht, aber immer noch ihre Grenzen hat.
Aber was tun, wenn ich nicht durch die Größe und den Typ der Quelldatei eingeschränkt sein möchte?
Wenn ich Webseiten, Elemente im Softwarecode, Datenbankdateien oder komplexe grafische Ausdrucke, die in inDesign erstellt wurden, übersetzen muss?
Und noch konkreter - was ist, wenn ich z. B. einen Onlineshop übersetzen muss, der mehrere Millionen Wörter umfasst?
Hier betritt Aspen die imaginäre Bühne als Übersetzungsbüro.
Für Kunden, die eine maschinelle Übersetzung benötigen, ist dies nur ein Schritt in unserem Verarbeitungsprozess innerhalb des Standard-Workflows; wir sind nicht durch Dateigröße, Anzahl der Dokumente oder Quellformat beschränkt.
Neben den Standardformaten wie MS Word, Excel, PowerPoint usw. können wir auch Übersetzungen der folgenden Formate anbieten:
- xml, resx, po, json, csv-Dateien...
- web-HTML- und php-Dateien...
- grafikdokumente, die in inDesign, Illustrator, FrameMaker, AutoCAD... erstellt wurden
- txt, inf, ini, reg Textdateien...
- und andere
Ein großer Vorteil ist die Verbindung zwischen den maschinellen Übersetzern und unseren CAT-Tools (Computer Assisted Translation). Hierbei handelt es sich um eine Softwareumgebung zur Erstellung von Übersetzungen unter Verwendung von Translation Memories und kundenindividuellen Terminologiedatenbanken.
Aber Vorsicht vor dem weit verbreiteten Missverständnis, was ein CAT-Tool eigentlich ist - es ist keine maschinelle Übersetzung, sondern nur eine Umgebung, in der professionelle Übersetzer arbeiten.
Die Kombination aus CAT-Tool und maschinellem Übersetzer ist für unsere Stammkunden stets profitabler als eine einfache Übersetzung über das Webinterface oder die Anwendung DeepL, Google oder andere Engines (Übersetzer).
Translation Memorys und Terminologiedatenbanken sorgen für bessere Konsistenz und genauere Übersetzungen.
Wir sind auch in der Lage, die maschinellen Übersetzer auf der Grundlage von Kundendaten zu schulen (in der Regel anhand von bereits angefertigten Übersetzungen). Derzeit ermöglicht DeepL kein Training, aber Google und andere Tools schon.
Jetzt gibt es nur noch eines zu tun – schreiben Sie uns an sales@aspena.com und wir beraten Sie gern, wie Sie Ihre Übersetzungen am besten bearbeiten können, entweder unter Verwendung einer maschinellen Übersetzung oder auf dem üblichen Weg durch einen menschlichen Übersetzer.
Es ist sehr wahrscheinlich, dass jede Variante der maschinellen Übersetzung die Zusammenarbeit mit einem menschlichen Übersetzer umfasst – entweder ein leichtes oder vollständiges Post-Editing oder eine Kombination aus linguistischem, technischem und druckvorbereitendem Korrekturlesen. Es gibt viele Möglichkeiten und Kombinationen, es kommt immer darauf an, was unsere Kunden erwarten und brauchen.
Verfasser: Břetislav Svoboda, Leiter der technischen und vertrieblichen Entwicklung