Project

Back to overview

Towards Computational Historiographical Modeling: Corpora and Concepts

English title Towards Computational Historiographical Modeling: Corpora and Concepts
Applicant Piotrowski Michael
Number 204305
Funding scheme Project funding
Research institution Sciences du langage et de l'information Faculté des lettres Université de Lausanne
Institution of higher education University of Lausanne - LA
Main discipline General history (without pre-and early history)
Start/End 01.02.2022 - 31.01.2026
Approved amount 930'272.00
Show all

All Disciplines (2)

Discipline
General history (without pre-and early history)
Information Technology

Keywords (5)

digital humanities; historiography; epistemology; formal modeling; methodology of history

Lay Summary (German)

Lead
Bislang haben sich die digitalen Geisteswissenschaften weitgehend damit begnügt, Methoden aus anderen Bereichen zu übernehmen und kaum eine eigene Methodologie entwickelt. Die Fokussierung auf Methoden und Werkzeuge ist ein großes Hindernis für die Entwicklung von Computermodellen, die uns helfen könnten, neue Erkenntnisse zu Forschungsfragen der Geisteswissenschaften zu gewinnen.
Lay summary

Inhalt und Ziel des Forschungsprojekts

Unser Ziel ist es, eine erkenntnistheoretische und methodologische Grundlage zu schaffen, um von Ad-hoc-Lösungen zu einem allgemeineren Verständnis zu gelangen. Wir konzentrieren uns auf zwei besonders dringende Fragen, die zusammen eine kritische Forschungslücke darstellen:

  1. Die digitalen Geisteswissenschaften stützen sich stark auf Korpora (Sammlungen von Texten, Bildern usw.). Die erkenntnistheoretischen Implikationen wurden jedoch weitgehend ignoriert. Wir schlagen vor, Korpora als phänomenotechnische Geräte zu betrachten: Einerseits modellieren sie das untersuchte Phänomen, andererseits konstruieren sie es.
  2. Modelle komplexer Phänomene beruhen auf zahlreichen Konzepten, die sich auf «Teilmodelle» beziehen. Als Bausteine stellen sie in den digitalen Geisteswissenschaften ein ernsthaftes erkenntnistheoretisches Problem dar, da sie die Grundlage für die Konstruktion von Korpora bilden, ohne genau definiert zu sein.

Wissenschaftlicher und gesellschaftlicher Kontext

Über eine bestimmte historische Forschungsfrage oder ein einzelnes Konzept hinaus wird das Projekt ein methodologisches und epistemologisches Licht auf Computermodelle in der Geschichtswissenschaft werfen. Die gewonnenen Erkenntnisse können auch zu einem besseren Verständnis von Computermodellen außerhalb der wissenschaftlichen Forschung beitragen.

 
Direct link to Lay Summary Last update: 16.12.2021

Lay Summary (French)

Lead
Jusqu’à présent, les humanités numériques se sont largement contentées d’emprunter des méthodes à d’autres domaines et n’ont guère développé de méthodologie qui leur est propre. L’accent mis sur les méthodes et les outils représente un obstacle majeur à la construction de modèles computationnels qui pourraient nous aider à acquérir de nouvelles connaissances sur les questions de recherche des sciences humaines.
Lay summary

Contenu et objectifs du travail de recherche

Nous visons à établir des bases épistémologiques et méthodologiques afin de passer de solutions ad hoc à une compréhension plus générale des questions en jeu. Nous nous concentrons sur deux questions particulièrement urgentes qui, ensemble, constituent une lacune critique dans la recherche :

  1. Les humanités numériques s’appuyent fortement sur les corpus (collections de textes, d’images, etc.). Cependant, les implications épistémologiques ont été largement ignorées. Nous proposons de considérer les corpus comme des dispositifs phénoménotechniques : d’une part, ils modélisent le phénomène étudié ; d’autre part, ils le construisent.
  2. Les modèles de phénomènes complexes reposent sur de nombreux concepts, références à des « sous-modèles ». Servant de blocs de construction, ils posent un sérieux problème épistémologique en humanités numériques, puisqu’ils sont à la base de la construction des corpus sans être bien définis.

Contexte scientifique et social du projet de recherche

Au-delà d’une question de recherche historique particulière ou d’un concept singulier, le projet apportera un éclairage méthodologique et épistémologique sur les modèles computationnels en historiographie. Les connaissances acquises peuvent également faciliter une meilleure compréhension des modèles computationnels en dehors de la recherche scientifique.

Direct link to Lay Summary Last update: 16.12.2021

Responsible applicant and co-applicants

Employees

Project partner

Associated projects

Number Title Start Funding scheme
190306 An Agile Approach Towards Computational Modeling of Historiographical Uncertainty 01.02.2020 Spark

Abstract

So far, digital humanities has largely contented itself with borrowing methods from other fields and has developed little methodology of its own. In our Spark pilot project “An Agile Approach Towards Computational Modeling of Historiographical Uncertainty” we have shown that the almost exclusive focus on methods and tools represents a major obstacle towards the construction of computational models that could help us to obtain new insights into humanities research questions (which are ultimately qualitative, “why?” questions) rather than just automate primarily quantitative processing.In the proposed project we therefore want to focus on two issues we have identified as particularly pressing, and which together constitute a critical research gap:1. regardless of the application domain, digital humanities research tends to rely heavily on corpora, i.e., curated collections of texts, images, music, or other types of data. However, the epistemological implications have so far been largely ignored. We propose to consider corpora as phenomenotechnical devices (Bachelard), like scientific instruments: corpora are, on the one hand, models of the phenomenon under study; on the other hand, the phenomenon is constructed through the corpus. We therefore want to study corpora as models to answer questions such as: How do corpora model and produce phenomena? What are commonalities and differences between different types of corpora? How can corpora-as-models be formally described in order to take their properties into account for research that makes use of them?2. Models of complex phenomena generally rely heavily on numerous concepts, e.g., (in history) textuality, feudalism, state, class, etc. Such concepts are effectively references to “submodels,” which serve as building blocks for larger models. Traditionally, these models were largely implicit and not formalized. This becomes a serious epistemological problem in digital humanities, because these concepts are the foundation for selecting data and building corpora. For example, a corpus of letters is based on the concept of “letter” (as distinct from other writings), or a data set for comparing some aspect of preliterate and literate societies is based on the concept of “literacy” (as distinct from “illiteracy”). The lack of a formalization of these concepts is currently a major weakness of computational research in the humanities: while the quantitative computational analyses are highly formalized, their qualitative foundations are shaky. Using the concept of “textuality,” central in the context of medieval manuscript studies, as a case study, we will investigate concepts as models: How do they function and how are they used? Are there structural similarities that would allow us to create a metamodel for formalizing concepts?The project will examine these issues in a historical context, but these are general issues in digital humanities, and we envision the results to be transferable to other contexts. We expect the project to make an important contribution to theory formation and help advance the digital humanities from project-specific, often ad hoc, solutions to particular problems to a more general understanding of the issues at stake.
-