Lead
Les systèmes de traduction automatique actuels opèrent phrase après phrase et ne propagent pas les informations acquises plus tôt dans un texte vers la suite du texte. Pourtant, cela peut-être utile, et parfois indispensable, à la traduction correcte de certains mots ou expressions qui dépendent des précédents choix de traduction. Par exemple, les références aux entités (noms propres, noms communs, ou pronoms) doivent être traduites de manière cohérente tout au long d’un texte.

Lay summary

Le but du projet MODERN est de détecter automatiquement les relations de dépendance entre les éléments d’un texte et d’intégrer ces informations au sein de systèmes de traduction automatique, afin d’améliorer de façon mesurable la qualité des textes traduits.  MODERN étudiera plus particulièrement les expressions référentielles, telles les groupes nominaux et les pronoms, et les relations discursives entre phrases. Ces deux types d’informations sont reliés, et leur traduction cohérente est un élément important de la qualité d’une traduction. 

MODERN proposera des modèles formels combinant les entités et les relations discursives d’un texte, fondés sur des théories linguistiques et des observations expérimentales, et intégrant des informations sur les entités discursives provenant de ressources encyclopédiques externes.  Ces modèles seront implémentés dans un cadre statistique et seront intégrés aux deux principales approches utilisées actuellement en traduction automatique, à savoir les systèmes statistiques comme Moses, ou à base de règles comme Apertium. La mesure des améliorations apportées sera reliée aux effets sur les lecteurs humains des différents choix de traduction.

Le projet MODERN étudiera quatre langues : l’anglais, le français, l’allemand et le néerlandais, avec des textes issus de deux domaines : des textes sur les Alpes extraits du corpus Text+Berg et des textes législatifs européens portant sur l’environnement (JRC-Acquis et Europarl).

Le projet représente un effort collectif, avec la collaboration de chercheurs en traduction automatique, en linguistique et en traitement automatique des langues.  Cette collaboration conduira au développement de systèmes effectifs, qui seront évalués de manière objective et réaliste.  Grâce à sa nouvelle approche de la traduction globale d’un texte, MODERN sera à la pointe des recherches internationales visant la construction de systèmes de traduction automatique d’une qualité suffisante pour leur utilisation autonome.