Lexical ambiguity in machine translation and its impact on the evaluation of output by users

Djiako, Gabriel Armand

Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-32358

Titel:	Lexical ambiguity in machine translation and its impact on the evaluation of output by users
VerfasserIn:	Djiako, Gabriel Armand
Sprache:	Deutsch
Verlag/Plattform:	universaar
Erscheinungsjahr:	2019
Erscheinungsort:	Saarbrücken
Kontrollierte Schlagwörter:	Linguistik Ambiguität Übersetzung
Freie Schlagwörter:	Machine Translation
DDC-Sachgruppe:	400 Sprache, Linguistik
Dokumenttyp:	Buch (Monographie)
Abstract:	Der kunstvolle Einsatz von Mehrdeutigkeit in der Politik und im Marketing hat viele Vorteile, weil Mehrdeutigkeit Politikern und Werbeagenturen dabei helfen kann, zwischen mehreren möglichen Bedeutungen zu navigieren und gleichzeitig effektiv zu kommunizieren, ohne Kontroverse auszulösen. Jedoch ist Mehrdeutigkeit in der maschinellen Übersetzung häufig als ein „wichtiger Engpass für Fortschritt” beschrieben worden (Dale, Moisl and Somers 2000). Obwohl viele Studien sich auf die Beschreibung der Mehrdeutigkeit als linguistisches und philosophisches Phänomen konzentrieren, hat bislang keine Studie die Auswirkung von Mehrdeutigkeit auf maschinell übersetzte Korpora gemessen. Diese quantitative Fallstudie setzt es sich zum Ziel, den Einfluss von Mehrdeutigkeit auf die Qualität von Übersetzungsergebnissen zu untersuchen und liefert somit konkrete Daten, um diese Auswirkungen zu messen. In einer empirischen Studie wurden ausgewählte Korpora, welche lexikalische Mehrdeutigkeit enthalten, mit unterschiedlichen M.Ü.-Systemen wie Google Translate und Personal Translator übersetzt. Dank einer komparativen bzw. kontrastiven Analyse menschlicher Urteile konnte die Qualitätsbewertung gemessen werden und demnach auch der Einfluss der Mehrdeutigkeit auf maschinell übersetzten Output. Zu diesem Zweck wurden Metriken wie Flüssigkeit und Adäquanz, die in den meisten Studien verwendet werden, eingesetzt. Zwei Reihen Korpora wurden verglichen: Korpora, die mehrdeutige Abschnitte enthalten und Korpora ohne mehrdeutige Lexeme. Basierend auf 10 Benutzer-Urteilen zur M.Ü.-Qualität zeigen wir, wie die Metriken der Flüssigkeit und Adäquanz durch Mehrdeutigkeit negativ beeinflusst werden. Unsere Untersuchungen zeigen, dass keine absolute Wechselbeziehung zwischen den für Flüssigkeit und Adäquanz gemessenen Werten besteht. Abschließend umfasst diese Arbeit zudem eine Übersicht unterschiedlicher Formen von Mehrdeutigkeit sowie Disambiguierungsansätze in der maschinellen Übersetzung. The artful use of ambiguity in politics and marketing presents many advantages, as ambiguity can help, both politicians and advertisers, navigate between several possible meanings while communicating effectively enough to not cause any controversy; however, ambiguity has often been described as a “key bottleneck for progress in Machine Translation” (Dale, Moisl and Somers 2000). While several studies have been centered on the description of ambiguity as a linguistic and philosophical phenomenon; there has been no study, to the best of our knowledge, that has measured its impact on machine translation output. This quantitative case study highlights the influence of ambiguity on machine translation’s output quality in the judgement of users thus providing concrete data to measure this impact. In an empirical study, selected corpora containing lexical ambiguities were translated using different Machine Translation (MT) systems such as Google Translate and Personal Translator. A comparative, and contrastive, analysis using human judgement helped to measure users’ judgement of quality and, by extension, the influence of ambiguity on MT output quality. To achieve this objective, the most common fluency and adequacy metrics were employed. Two sets of corpora were compared: firstly, corpora containing ambiguous sections; and secondly, corpora without ambiguous lexemes. Based on 10 users’ judgement of MT output quality, we show that both fluency and adequacy metrics are negatively influenced by the presence of ambiguous words. Our experiments, also, shed light on the fact that no absolute correlation exists between fluency- and adequacy scores. Lastly, this dissertation also includes a comprehensive survey of different forms of ambiguities and ambiguity resolution techniques in MT.
Link zu diesem Datensatz:	urn:nbn:de:bsz:291-universaar-1764 hdl:20.500.11880/30871 http://dx.doi.org/10.22028/D291-32358
ISBN:	978-3-86223-231-4
Schriftenreihe:	Dissertationen aus der Philosophischen Fakultät der Universität des Saarlandes
Datum des Eintrags:	11-Mär-2021
Fakultät:	P - Philosophische Fakultät
Fachrichtung:	P - Sprachwissenschaft und Sprachtechnologie
Professur:	P - PD Dr. Peter Godglück
Sammlung:	Bücher Online

Dateien zu diesem Datensatz:

Datei	Beschreibung	Größe	Format
LexicalAmbiguityinMachineTranslation.pdf		2,4 MB	Adobe PDF	Öffnen/Anzeigen

Export: BibTex Statistik anzeigen

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.