Projekt

Zurück zur Übersicht

Computational analysis of dependency length and information-theoretic factors in word order variation

Gesuchsteller/in Gulordava Kristina
Nummer 168696
Förderungsinstrument Doc.Mobility
Forschungseinrichtung School of Informatics University of Edinburgh
Hochschule Institution ausserhalb der Schweiz - IACH
Hauptdisziplin Weitere Sprachen
Beginn/Ende 01.09.2016 - 28.02.2017
Alle Daten anzeigen

Alle Disziplinen (2)

Disziplin
Weitere Sprachen
Informatik

Keywords (7)

word order; sentence processing; computational modelling; multilingual analysis; noun phrase; parsing; linguistics

Lay Summary (Italienisch)

Lead
L’ordine delle parole è un soggetto di studio fondamentale in linguistica. Sovente, in una frase, sono possibili due ordini alternativi di parole e la scelta tra loro dipende da diversi fattori. Questo progetto intende analizzare due fattori rilevanti: la distanza tra parole dipendenti e il contenuto informativo associato a ciascuna parola.??
Lay summary

Soggetto e obiettivo

Questo progetto si concentra sulla posizione dell’aggettivo rispetto al nome nelle lingue romanze, come nel caso di una serata magnifica e una magnifica serata dove l’aggettivo può apparire prima o dopo il nome. La ragione per cui il locutore utilizza una delle due posizioni dipende da vari fattori. Un fattore sintattico è la distanza tra le parole dipendenti: le distanze più corte sono preferite nella produzione e nella comprensione linguistica; per esempio, la frase una serata del festival magnifica risulta stonata siccome serata e magnifica sono distanti. Un altro fattore che influenza la comprensione della lingua è il contenuto informativo delle parole, misurato dalla loro frequenza nella lingua.

L’obiettivo di questo progetto è di verificare se questi due fattori - la distanza tra le parole dipendenti e il contenuto informativo delle parole - influenzino la posizione degli aggettivi nelle lingue romanze. Per farlo, un’analisi statistica sarà condotta su un grande numero di frasi contenenti aggettivi estratti da testi in francese, italiano, spagnolo e portoghese.

Contribuzione scientifica

Questo lavoro raccoglierà nuovi dati favorendo una migliore conoscenza di un fenomeno linguistico comune a tutte le lingue - la scelta possibile tra ordini alternativi delle parole - e permetterà di approfondire la comprensione dei fattori fondamentali che modellano la sintassi della lingua.

Direktlink auf Lay Summary Letzte Aktualisierung: 09.07.2016

Verantw. Gesuchsteller/in und weitere Gesuchstellende

Wissenschaftliche Veranstaltungen

Aktiver Beitrag

Titel Art des Beitrags Titel des Artikels oder Beitrages Datum Ort Beteiligte Personen
Cognitive Modeling and Computational Linguistics Workshop at EACL 2017 Poster Incremental generative model of sentence linearisation and word order variation 03.04.2017 Valencia, Spanien Gulordava Kristina;


Abstract

This project aims at investigating word order variation and the factors which shape this variation within a language and across languages. In particular, the focus of the project is on grammatical factors such as the length of dependencies between related words and information-theoretic factors such as predictability of a word given its context. It has been shown experimentally that information-theoretic factors affect how human listeners process sentences. In this project, I will investigate whether parallel effects can be found in language use as reflected in textual corpora. To study the interaction of dependency lengths and information-theoretic factors, I propose to use a new powerful statistical model, namely an incremental probabilistic generative model, which will be adapted from language processing and computational linguistic literature to the task of word order prediction.
-