Project

Back to overview

SERMO I: méthode d’annotation et d’exploitation de corpus paralittéraires pour l’analyse en linguistique diachronique

Applicant Skupien Dekens Carine
Number 160030
Funding scheme Project funding (Div. I-III)
Research institution Inst. de langue et civilisation françaises Université de Neuchâtel
Institution of higher education University of Neuchatel - NE
Main discipline Romance languages and literature
Start/End 01.09.2015 - 31.08.2018
Approved amount 536'918.00
Show all

All Disciplines (2)

Discipline
Romance languages and literature
Information Technology

Keywords (9)

Refuge huguenot; linguistique de corpus; linguistique diachronique; Analyse du discours historique; syntaxe historique; Réforme; Sermons; Français préclassique ; Français classique

Lay Summary (German)

Lead
Entwicklung einer wissenschaftlichen Methode von Analyse und programmgestützter Korpus-Auswertung von protestantischer Predigten in französischer Sprache
Lay summary

Ziel des Projekts SERMO I ist die Entwicklung einer wissenschaftlichen Methode von Analyse und programmgestützter Korpus-Auswertung von Texten, die dem vorklassischen und dem klassischen Französisch zuzurechnen sind. Dieser Ansatz ist der diachronen Sprachwissenschaft ebenso verpflichtet wie der Geschichte nicht-literarischer Genres und der historischen Diskursanalyse. Basis ist die Erstellung eines annotierten Korpus protestantischer Predigten in französischer Sprache, die zwischen 1550 und 1750 in Genf gedruckt wurden. Diese Texte werden lemmatisiert und auf mehreren Ebenen annotiert: morphosyntaktisch, diskursiv, rhetorisch, historisch bzw. theologisch. Eine Internetpräsenz wird die flexible wissenschaftliche Nutzung und Abfrage des Korpus ermöglichen.

Der gesamte Prozessverlauf wird dokumentiert. Ein praktischer Leitfaden wird die Grundlagen einer übertragbaren und reproduzierbaren Methode der historischen Analyse annotierter Korpora legen.

 

Direct link to Lay Summary Last update: 23.06.2015

Lay Summary (French)

Lead
Méthode d’annotation et d’exploitation d'un corpus de sermons protestants de 1550 à 1750 pour l’analyse en linguistique diachronique
Lay summary

SERMO I

Le projet SERMO I  a pour but de développer une approche scientifique pour l’analyse et l’exploitation semi-automatique de corpus de textes de français préclassique et classique, dans une perspective de linguistique diachronique, d’histoire des genres paralittéraires et d’analyse du discours en diachronie. Il se base sur la constitution d’un corpus annoté de sermons protestants en langue française de 1550 à 1750 imprimés à Genève. Ces textes seront lemmatisés, et étiquetés à différents niveaux : morpho-syntaxique, discursif, rhétorique, historique ou théologique. Un site internet permettra la consultation du corpus et son exploitation selon les intérêts du chercheur.

Toute la procédure sera documentée et une méthode pratique sera publiée qui permettra de poser les bases d’une approche partageable et reproductible pour l’analyse diachronique des corpus annotés.

Direct link to Lay Summary Last update: 23.06.2015

Lay Summary (English)

Lead
Development of a scientific approach for semi automatic analysis and exploitation of a text corpus of Protestant sermons from 1550 to 1750 French language
Lay summary

The goal of the SERMO I project is the development of a scientific approach for semi automatic  analysis and exploitation of a text corpus in pre-classical and classical French, in the context of diachronic linguistics, history of  paraliterary genres and diachronic analysis of speeches.

It is based on the construction of an annotated corpus of Protestant sermons from 1550 to 1750 French language, printed in Geneva. These texts will be lemmatised and tagged at different levels: morphosyntactical, discursive, rhetorical, historical and theological.  A website will enable the access to the corpus and its exploitation according to researcher needs.

The whole procedure will be documented and a practical method that will enable to lay a foundation for a sharable and reproducible approach to the diachronic analysis of the annotated corpus will be published.

Direct link to Lay Summary Last update: 23.06.2015

Responsible applicant and co-applicants

Employees

Publications

Publication
Le sermon comme source de langue orale: typologie, méthodologie et hypothèses.
Meli Cinthia (2018), Le sermon comme source de langue orale: typologie, méthodologie et hypothèses., in Philologia, LXVIII(2), 87-112.
Derniers regards sur la prédication réformée du Grand Siècle : Jean La Placette, Jean-Frédéric Ostervald et Pierre Roques
Meli Cinthia, Derniers regards sur la prédication réformée du Grand Siècle : Jean La Placette, Jean-Frédéric Ostervald et Pierre Roques, in XVIIe siècle.
A grammar of authority? – Directive Speech Acts and terms of address in two single-genre corpora of Classical French.
GerstenbergAnnette, Skupien DekensCarine, A grammar of authority? – Directive Speech Acts and terms of address in two single-genre corpora of Classical French., in Journal of Historical Pragmatics.
L’art de s’adresser à « l’homme du commun » : principes et méthodes du langage simple chez quelques traducteurs et prédicateurs réformés français au XVIe siècle
Skupien DekensCarine, L’art de s’adresser à « l’homme du commun » : principes et méthodes du langage simple chez quelques traducteurs et prédicateurs réformés français au XVIe siècle, in Seizième Siècle, 2019.
La "langue de Canaan" à l’épreuve des sermons (1600-1750) : l’exemple des psaumes
Skupien Dekens Carine, La "langue de Canaan" à l’épreuve des sermons (1600-1750) : l’exemple des psaumes, in Bossuet, 2018(9).
Prédication et polémique sous le régime de l’édit de Nantes : trois études de cas
MeliCinthia, Prédication et polémique sous le régime de l’édit de Nantes : trois études de cas, in Etudes Episteme , 2020.

Datasets

SERMO

Author Skupien Dekens, Carine
Publication date 30.08.2018
Persistent Identifier (PID) http://sermo.unine.ch
Repository SERMO
Abstract
Toutes les données sont librement accessibles, et sauvegardées selon les principes FAIR par l'Université de Neuchâtel sur un serveur dédié. Un mail de Mme Eva Moser, du 10 octobre 2018, m'autorise à conserver nos données de cette manière, sans autres démarches.Comme il s'agit du résultat principal de notre travail, toutes les publications scientifiques y sont afférentes.

Collaboration

Group / person Country
Types of collaboration
Projet Ecriture et oralité /Université de Genève Switzerland (Europe)
- in-depth/constructive exchanges on approaches, methods or results
Bibliothèque des Pasteurs, Neuchâtel Switzerland (Europe)
- Research Infrastructure
Université de Potsdam Germany (Europe)
- in-depth/constructive exchanges on approaches, methods or results
- Publication
- Research Infrastructure
- Exchange of personnel
Atilf /Université de Lorraine / Nancy France (Europe)
- in-depth/constructive exchanges on approaches, methods or results
- Research Infrastructure
- Exchange of personnel
ICAR, Université de Lyon, Prof. Denis Vigier France (Europe)
- in-depth/constructive exchanges on approaches, methods or results
- Research Infrastructure
- Exchange of personnel
Groupe de recherche en linguistique française, Université de Neuchâtel, Prof. C. Rossari Switzerland (Europe)
- in-depth/constructive exchanges on approaches, methods or results
Institut d'informatique, Université de Neuchâtel Switzerland (Europe)
- in-depth/constructive exchanges on approaches, methods or results
- Research Infrastructure
Txm / Ecole Normale Supérieure, Lyon France (Europe)
- in-depth/constructive exchanges on approaches, methods or results
- Research Infrastructure
- Exchange of personnel

Scientific events

Active participation

Title Type of contribution Title of article or contribution Date Place Persons involved
7ème Colloque international : Le discours rapporté à l’ère numérique : du discours cité au discours partagé Talk given at a conference Usage et fonction du discours direct dans un corpus de sermons : apport de la linguistique outillée 20.06.2018 Université Libre de Bruxelles, Belgium Augustyn-Gaultier Magdalena; Meli Cinthia; Dolamic Ljiljana;
Le combat de la chaire : éthique et modalités rhétoriques de la polémique dans la prédication Talk given at a conference Prédication et polémique sous le régime de l’édit de Nantes : trois études de cas 06.06.2018 Sorbonne nouvelle, France Meli Cinthia;
Séminaire EA LiLPa ER Scolia, Université de Strasbourg Individual talk Ponctuation et cohésion: ce que les premiers mots nous disent. Etude sur un corpus de textes religieux du XVI-XVIIIe siècle 26.01.2018 Strasbourg, France Skupien Dekens Carine;
Colloque de la société internationale de diachronie du français Talk given at a conference Une typologie fonctionnelle de commentaires métadiscursifs à travers le corpus Sermo 10.01.2018 Neuchâtel, Switzerland Meli Cinthia; Dolamic Ljiljana; Augustyn-Gaultier Magdalena;
9e Journées Internationales de la Linguistique de Corpus Talk given at a conference Repérage semi-automatique du discours direct : acquisition et évaluation sur corpus Sermo 04.07.2017 Université Grenoble Alpes, France Dolamic Ljiljana; Augustyn-Gaultier Magdalena;
congrès international NASSCFL Littérature, livre et librairie au 17e siècle Talk given at a conference SERMO : bilan intermédiaire d’un projet interdisciplinaire 21.06.2017 Lyon, France Meli Cinthia;
colloque de la Société d’études du 17e siècle Le protestantisme français au 17e siècle Talk given at a conference Derniers regards sur la prédication du Grand Siècle 21.06.2017 Université d'Angers, France Meli Cinthia;
Colloque DIACHRO VIII Talk given at a conference Caractéristiques des segments du discours direct dans le corpus SERMO (XVI-XVIIIe siècles) 02.02.2017 Université de Strasbourg, France Dolamic Ljiljana; Augustyn-Gaultier Magdalena;
DIACHRO VIII Talk given at a conference AMELIORER ET APPLIQUER LES OUTILS NUMERIQUES OBSERVER ET DECRIRE LE CHANGEMENT LINGUISTIQUE DU FRANÇAIS (PRE)CLASSIQUE 02.02.2017 Strasbourg, France Skupien Dekens Carine;
Corpus écrits, corpus oraux : de la morphosyntaxe au discours - Rencontres de linguistique franco-suisses Talk given at a conference Le corpus SERMO, de la transcription à la reconnaissance automatique des phrases. Méthodologie et chaîne de traitement 13.10.2016 Université de Neuchâtel, Switzerland Skupien Dekens Carine; Dolamic Ljiljana; Augustyn-Gaultier Magdalena;
Langues romanes. Corpus, genres, niveaux d’analyse (ORAL), Talk given at a conference Le sermon comme source sur la langue orale : typologie, méthodologie, hypothèses 13.05.2016 Cluj-Napoca, Université Babes-Bolyai, Romania Meli Cinthia;
Séminaire GADGES Individual talk A la recherche des origines du Patois de Canaan 04.02.2016 Lyon, France Skupien Dekens Carine;


Knowledge transfer events



Self-organised

Title Date Place
SERMO DEMO 30.08.2018 Neuchâtel, Switzerland

Communication with the public

Communication Title Media Place Year
Talks/events/exhibitions SERMO DEMO Western Switzerland International 2018

Use-inspired outputs

Software

Name Year
SERMO 2018


Associated projects

Number Title Start Funding scheme
157934 Edition critique de 57 sermons inédits de Calvin sur Esaïe 01.01.2018 Editionen
124010 Traduire pour le peuple de Dieu. La syntaxe française dans la traduction de la Bible par Sébastien Castellion, Bâle, 1555 01.10.2008 Publication grants

Abstract

Ce projet a pour but de développer une approche scientifique cohérente et solide pour l’analyse et l’exploitation automatique de corpus de textes de français préclassique et classique, dans une approche de linguistique diachronique, d’histoire des genres paralittéraires et d’analyse du discours en diachronie. Il constitue la base méthodologique du projet FNS SERMO (10FE15_157915 Editions 2017-2020) qui permettra de créer un vaste corpus annoté de sermons protestants en langue française de 1550 à 1750. Il s’agira donc ici d’établir des choix méthodologiques en fonction d’hypothèses scientifiques étayées, d’élaborer une interface et un logiciel pour la vérification des hypothèses sur un échantillon du corpus, puis de tester à la fois les choix méthodologiques et le logiciel d’analyse sur un corpus partiel. Une méthode pratique sera publiée qui permettra d’une part d’optimiser la faisabilité de la phase Editions et de procéder plus rapidement à la mise à disposition de la communauté scientifique concernée du corpus annoté, d’autre part de poser les bases d’une approche partageable et reproductible pour l’analyse diachronique des corpus annotés.
-