Lead
L’objectif de ce projet de recherche est d’explorer "l’histoire de l’histoire" de Venise grâce à de nouvelles approches algorithmiques. Ce projet a pour ambition de reconstruire une chronologie des influences, d’identifier les débats académiques et les écoles de pensées au sein des études vénitiennes. Pour cela, il explore de nouvelles méthodes pour extraire automatiquement les citations dans des documents numérisés et définit un système d’analyse bibliométrique spécifiquement dédié aux particularismes des modes de citations dans les sciences humaines. Cette cartographie rétroactive et les outils développés pour la produire ont aussi pour but d’identifier des pistes de recherches prometteuses pour étudier Venise et ses archives dans les années qui viennent.

Lay summary
Le projet est construit autour d’un corpus de plus de 5000 monographies et journaux, publiés durant les 200 dernières années, traitant de tous les aspects de l’histoire vénitienne. Les citations explicites et implicites présentes dans chaque document de ce corpus sont automatiquement extraites en utilisant une forme d’apprentissage supervisé ayant pour base la technique des “Conditional Random Fields”. À partir de ces extractions, des réseaux de citations sont construits à la fois pour les sources primaires et secondaires. L’analyse de ces réseaux offre la possibilité non seulement de regrouper les documents selon des domaines thématiques et des écoles de pensées, mais aussi de détecter les "tensions" entre des groupes de documents citant les mêmes sources primaires, mais des sources secondaires divergentes. Sur ces bases, une nouvelle méthode d’analyse utilisant le concept de "spectre bibliométrique" permet de définir de nouvelles typologies de documents et d’explorer des approches historiographiques inédites.  

Ce projet s’inscrit dans le cadre d’un projet de numérisation de grande ampleur, la Venice Time Machine, ayant pour objectif de mettre à disposition des chercheurs un large ensemble de sources primaires vénitiennes. Il ambitionne de donner une nouvelle compréhension de l’articulation entre les sources primaires et secondaires par l’intermédiaire d’un moteur de recherche qui intègre des outils de visualisation. Les méthodes d’analyse et le processus pour l’extraction, le groupement et la visualisation des réseaux de citations sont extrêmement généraux et pourraient être appliqués à de nombreux autres corpus, au-delà de cette première étude de cas vénitienne.