Projekt

Zurück zur Übersicht

Rich Context in Neural Machine Translation

Titel Englisch Rich Context in Neural Machine Translation
Gesuchsteller/in Volk Martin
Nummer 169888
Förderungsinstrument Projekte
Forschungseinrichtung Institut für Computerlinguistik Universität Zürich
Hochschule Universität Zürich - ZH
Hauptdisziplin Weitere Sprachen
Beginn/Ende 01.01.2017 - 31.12.2019
Bewilligter Betrag 463'263.00
Alle Daten anzeigen

Alle Disziplinen (2)

Disziplin
Weitere Sprachen
Informatik

Keywords (5)

Machine Translation; Word Embeddings; Multilingual Models; Neural Networks; Discourse Processing

Lay Summary (Deutsch)

Lead
Das führende Modell in der maschinellen Übersetzung war in den letzten Jahren der sogenannte statistische Ansatz: Das Übersetzungssystem lernt aus übersetzten Texten Wortfolgen, die einander entsprechen (z.B. the nice car - das schöne Auto). Diese parallelen Phrasen werden neu kombiniert um Übersetzungen für neue Texte zu erzeugen.Bei diesem Vorgehen lassen sich jedoch die Abhängigkeiten, die über den näheren Kontext eines Wortes, oder gar über Satzgrenzen hinausgehen, nur schlecht berücksichtigen.Ein neuer Ansatz, der in diesem Projekt untersucht werden soll, nutzt neuronale Netzwerke, die teilweise Gehirnstrukturen nachempfunden sind, um direkt von einer zur anderen Sprache zu übersetzen.
Lay summary

Inhalt und Ziel des Forschungsprojekts
Neuronale maschinelle Übersetzung ist ein neuer Ansatz, der viele spannende Forschungsmöglichkeiten bietet.
Im ersten Teil des Projekts werden wir eine Untersuchung zu den Stärken und Schwächen der alten Statistik-Modelle im Vergleich zur Übersetzung mit neuronalen Netzwerken durchführen.
Die meiste Forschung in maschineller Übersetzung fokussiert auf Englisch als Quell- oder Zielsprache.
In diesem Projekt werden wir hingegen mit den drei Schweizer Landessprachen Deutsch, Französisch und Italienisch arbeiten.
Wir werden daher nicht nur die verschiedenen Modelle gegeneinander testen, sondern auch die Übersetzungsqualität auf unterschiedlichen Sprachpaaren.
Im zweiten Teil des Projekts werden wir neuronale Übersetzungssysteme nach dem neusten Stand der Technik für die offiziellen Sprachen der Schweiz erstellen.

Wissenschaftlicher und Gesellschaftlicher Kontext
Unser Ziel ist es, einerseits die Forschung zur automatischen Übersetzung mit neuronalen Netzwerken voranzubringen, indem wir neue Eigenschaften in die bestehenden Modelle integrieren und diese auf wenig erforschte Sprachpaare anwenden.
Andererseits möchten wir konkret maschinelle Übersetzungsysteme für die offiziellen Landessprachen der Schweiz in der bestmöglichen Qualität erstellen.

Keywords
machine translation, neural networks, neural machine translation, parallel corpora

 

Direktlink auf Lay Summary Letzte Aktualisierung: 25.10.2016

Verantw. Gesuchsteller/in und weitere Gesuchstellende

Mitarbeitende

Verbundene Projekte

Nummer Titel Start Förderungsinstrument
149841 Hybrid Machine Translation for Morphologically Rich Languages 01.01.2014 Projektförderung (Abt. I-III)
147653 MODERN: Modeling discourse entities and relations for coherent machine translation 01.08.2013 Sinergia
126999 Domain-specific Statistical Machine Translation 01.01.2010 Resource not found: '3cfa3371-69b0-4730-9d42-150eea4471e1'

Abstract

Machine translation has been dominated by phrase-based statistical machine translation (SMT) for the last decade, even though SMT comes with some well known limitations regarding the performance of these systems. For instance, phrase-based models need to make strong independence assumptions, and only consider local context during translation, which makes it hard to model phenomena such as long-distance dependencies within sentences.Recently, a new approach to machine translation systems has received considerable attention: machine translation with neural networks. Even though artificial neural networks have been studied for many years in other disciplines, they are a new and very promising area of research within machine translation. This includes not only end-to-end translation with neural networks, but also phrase-based or syntax-based models with neural components (e.g. neural language models).In this project, we will work on end-to-end neural machine translation (NMT). We will start with a detailed comparison of NMT with corresponding phrase-based models in order to pinpoint its advantages and shortcomings. Subsequently, we will explore the new opportunities of neural MT with respect to the inclusion of additional information into the translation model: because the translation can be conditioned on arbitrary real-valued input features without having to resort to strong independence assumptions, neural MT can be improved by providing novel types of information as rich context inputs to the translation task, such as document-level information, linguistic annotation, multiple source languages, or side constraints.It has been rather cumbersome to include document-level information into SMT systems. Neural MT provides a more elegant and straight-forward way to include lexical preferences which have been derived from neighboring sentences. This will help to improve lexical choice which is still one of the major problems in machine translation. Linguistic annotation such as Part-of-Speech tags, morphological features and dependency relations have not resulted in much of an improvement in SMT systems. Still, our intuition tells us that the quality of MT systems should improve with the inclusion of additional layers of linguistic information. We will investigate how to best include linguistic features in NMT. Often we have translations of a given text not only in one language but in multiple languages when we need to create another translation in one more language. Neural MT offers a way to combine the evidence from multiple source languages when translating into a new language.In this project, we will explore the new possibilities of neural machine translation to advance state-of-the-art MT systems for the three major languages of Switzerland: French, German and Italian.
-