Project

Back to overview

Querying the Digital Archive of Science: Distant Reading, Semantic Modeling and Representation of Knowledge

Applicant Volynskaya Alina
Number 192402
Funding scheme Doc.CH
Research institution DHLAB - Digital Humanities Laboratory College of Humanities École Polytechnique Fédérale de Lausanne
Institution of higher education EPF Lausanne - EPFL
Main discipline General history (without pre-and early history)
Start/End 01.03.2020 - 29.02.2024
Approved amount 234'861.00
Show all

Keywords (6)

archives of science; history of science; digital methods; knowledge representation; distant reading; semantic modeling

Lay Summary (French)

Lead
La science devient de nos jours de plus en plus numérique, et il en va de même pour ses archives, ce qui donne naissance à de nouvelles pratiques de recherche et ouvre de nouvelles perspectives pour l'historien. Les collections numériques se distinguent clairement des lieux de mémoire traditionnels remplis d'objets matériels soigneusement sélectionnés et conservés. Comment peut-on rendre les archives scientifiques numériques plus parlantes pour les historiens et plus accessibles au grand public ?
Lay summary

Titre du projet de recherche

Querying the Digital Archive of Science: Distant Reading, Semantic Modeling and Representation of Knowledge

Questionner les archives numériques de la science : lecture distante, modélisation sémantique et représentation des savoirs

Contenu et objectifs du travail de recherche

Par rapport aux sciences humaines, les sciences de la nature ne se préoccupent pas autant de leur propre passé. Les institutions scientifiques manquent souvent d'une politique mémorielle cohérente. Cela est particulièrement vrai pour les disciplines qui évoluent rapidement, comme la physique des particules ou l’informatique, dont les données périment vite et semblent perdre leur valeur presque instantanément. Mais en réalité, les archives scientifiques contiennent beaucoup plus que ce la science elle-même ne cherche à préserver : ses “restes”, tels que les brouillons, les protocoles d'hypothèses rejetées et d'expériences ratées, les instruments obsolètes, la documentation caduque, la correspondance interne, etc. Pourtant, ces restes sont indispensables à qui souhaite comprendre aussi bien l'histoire de la pensée que celle en devenir. Comment faire parler ces reliquats en tenant compte du tournant numérique et des capacités des nouvelles technologies ?

Pour répondre à ces questions, je propose deux pistes de réflexion. Premièrement, j'examinerai les infrastructures et les supports des archives scientifiques numériques (en particulier la modélisation sémantique), en cherchant à déterminer les conceptions du savoir que ces technologies impliquent. Plus largement, quelles sont les diverses qualités et fonctions que doit prendre en compte un modèle conceptuel de l’archive scientifique ? Deuxièmement, je me pencherai sur les possibilités d'interprétation offertes par ces infrastructures. Je me concentrerai ainsi sur la lecture distante ou distant reading (c'est-à-dire la lecture au moyen des méthodes informatiques) afin de questionner et de tester les potentialités de cette méthode lorsqu’on l’applique aux archives scientifiques.

Contexte scientifique et social du projet de recherche

Le projet se situe au carrefour des sciences humaines et de la science des données, de l'histoire des sciences et des études des médias. Il contribuera à dégager des bonnes pratiques dans le domaine de la politique mémorielle des institutions scientifiques, ainsi que dans celui de l'histoire numérique des sciences. En exposant les moyens de rendre les archives plus utiles pour les chercheurs et de les valoriser aux yeux du grand public, l'étude sera utile à la fois pour les institutions scientifiques, archivistiques et muséales, ainsi que pour la recherche.


Direct link to Lay Summary Last update: 13.02.2020

Responsible applicant and co-applicants

Employees

Abstract

The archive of science is the place where scientific practices are sedimented in the form of drafts, protocols of rejected hypotheses and failed experiments, obsolete instruments, outdated documentation, internal correspondence, and other leftovers. Today, just as science goes more and more digital, so does its archive, giving rise to new research practices and opening new frontiers of knowledge for the historian (from big data to the longue durée). These collections clearly differ from the traditional lieux de mémoire filled with thoroughly selected and carefully stored tangible objects. What do these new digital repositories do to archival items? What regimes of knowledge and memory do they presuppose? How can they be made meaningful for queries of the historians and of the wider public? To answer these questions, my thesis will outline new hermeneutics for the digital archive of science, looking both at its infrastructures (Linked Data technologies) and its methods (distant reading). Mixing theoretical reflection with case studies based on the archives of CERN and EPFL, my study will assemble the elements of a humanist (instead of engineering-oriented) ontology for the scientific archive, transferring concepts and perspectives from the history of science into a computational language. By questioning the epistemological foundations of the digital archive of science, as well as the ways of processing and interpreting such an archive, my research will provide a critical contribution to the good practices of both the computational history of science and the archival policies of scientific institutions.
-