Project

Back to overview

Dynamic Data Ingestion (DDI): Server-side data harmonization in historical research. A centralized approach to networking and providing interoperable research data to answer specific scientific questions.

English title Dynamic Data Ingestion (DDI): Server-side data harmonization in historical research. A centralized approach to networking and providing interoperable research data to answer specific scientific questions.
Applicant Gubler Kaspar
Number 190161
Funding scheme Spark
Research institution Abteilung für Mittelalterliche Geschichte Historisches Institut Universität Bern
Institution of higher education University of Berne - BE
Main discipline General history (without pre-and early history)
Start/End 01.02.2020 - 31.01.2021
Approved amount 99'010.00
Show all

Keywords (4)

Digital Humanities; Linked Open Data; Data harmonization; Prosopography

Lay Summary (German)

Lead
In den digitalen Geisteswissenschaften (Digital Humanities) gibt es zahlreiche Bestrebungen und Initiativen, Datenbanken miteinander zu verknüpfen, insbesondere solche mit biografischem Material. Ziel solcher Verknüpfungen ist es, auf einen Blick sämtliche verfügbaren biografischen Informationen (Daten) zu einer Person oder zu einem Personenkreis zu erhalten, um neue Muster und Trends in den Einzel- oder Kollektivbiografien erkennen und erforschen zu können.
Lay summary
Der Vernetzungsbedarf von geisteswissenschaftlichen Projekten mit Forschungsdatenbanken ist in den vergangenen Jahren stetig gestiegen, insbesondere im Bereich der kontextualisierten digitalen Prosopographie, die sich heute nicht mehr nur auf personenbezogene Daten stützt und bestimmte Personenkreise näher untersucht, sondern die Biografien in den historischen Kontext einbettet und damit Wissensräume digital rekonstruieren bzw. sichtbar machen kann. Netzwerkanalysen und Visualisierungen von biografischen Stationen auf Karten und in Zeitreihen sind mittlerweile zentrale Instrumente entsprechender Untersuchungen. Trotz dieser neuen technischen Möglichkeiten und intensiver internationaler Zusammenarbeit zwischen verschiedenen Forschungsprojekten ist es jedoch bislang nicht gelungen, biografische Forschungsdaten über elementare Verknüpfungen wie etwa Personen und deren Namensvarianten hinaus miteinander zu verbinden bzw. abzugleichen und zu harmonisieren. Das Ziel wäre eine öffentliche Suchfunktion über mehrere Datenbanken (mit biografischem Material) hinweg, welche dank detaillierter und nicht nur elementar harmonisierter biografischer Datenbestände neue Muster in den Einzel- und Kollektivbiografien sichtbar und neue Fragestellungen möglich macht. Gescheitert sind solche Bestrebungen bisher an der Schwierigkeit der Projekte, sich auf eine gemeinsame Sprache festzulegen, d.h. gemeinsame biografische Kategorien für den Datenabgleich festzulegen. Darüber hinaus bedeutet das Erstellen und Warten gemeinsamer Kategorien für die einzelnen Projekte zum Teil erheblichen Aufwand. Hier setzt das DDI-Modul dieses Projekts an, das die Daten von den einzelnen Projekten auf einem zentralen Server bündelt, dort anschliessend die Datenharmonisierung strukturiert vornimmt und die gemeinsamen Kategorien übersichtlich darstellt. Dadurch müssen die einzelnen Projekte ihre Datenbankstrukturen bzw. ihre biografischen Kategorien auf ihren lokalen Servern nicht anpassen und gewinnen zudem einen besseren Überblick zum Stand der Datenharmonisierung zwischen den einzelnen Projekten.


Direct link to Lay Summary Last update: 06.12.2019

Responsible applicant and co-applicants

Employees

Communication with the public

Communication Title Media Place Year
New media (web, blogs, podcasts, news feeds etc.) Data Ingestion Episode I – A New Hope Historical Data in Science International Italian-speaking Switzerland German-speaking Switzerland Western Switzerland Rhaeto-Romanic Switzerland 2020
New media (web, blogs, podcasts, news feeds etc.) Kick off SPARK Project: Dynamic Data Ingestion Historical Data in Science Western Switzerland Italian-speaking Switzerland German-speaking Switzerland Rhaeto-Romanic Switzerland International 2020
New media (web, blogs, podcasts, news feeds etc.) Project description Historical Data in Science Western Switzerland German-speaking Switzerland International Rhaeto-Romanic Switzerland Italian-speaking Switzerland 2020

Abstract

The networking needs of existing databases of historical research are very high, especially in the field of Contextualized Digital Prosopography, which today no longer relies solely on personal data, but digitally reconstructs knowledge biographies and spaces.In one area of this research, Digital Academic Prosopography, however, despite international initiatives, it has not yet been possible to harmonise the numerous databases available in Europe and to make them available to research and the public in an overarching search with exploratory objectives. The reasons for this chronic failure, according to the applicant, who as a leading member of a research network on Digital Academic History has profound knowledge of the problem, are to be found in the fact that(a) too many projects with too different data structures have been involved in data harmonisation, which has so far prevented the creation of a common ontology; and(b) attempts were made to adapt the project-specific data structures locally on the relevant project server in order to harmonise the data with other projectsc) no software with a graphical interface for dynamic data ingestion via API (Application Programming Interface) exists, i.e. dynamic data import into a central databaseThe originality and novelty of the approach pursued here for networking and harmonizing research data is to make these processes more effective and centralized bya) a manageable focus group with few similarly structured databases is formed,b) however, the structures of these databases on the local project servers are not yet changed, but only by means of Dynamic Data Ingestion according to jointly defined ontology on the central server.c) a graphical interface (DDI module) which makes Dynamic Data Ingestion via interface (API) possible even without special programming knowledgeThe implementation takes place in three phases. First the DDI module is programmed and implemented for the software X. Software X is a virtual research environment. Then the shared ontology for the data networking is determined with the participating projects on the basis of common quality and semantic criteria. Then the data of the projects are harmonized according to ontology with the DDI module on the central server and the project is published as a case study. If the project is successful, various effects can be expected. In the scientific field, on a technical and conceptual level, with the centralized approach, which will show a possible way to data harmonization. Scientifically and not least economically, the DDI module will give impetus to research because it is not limited to data content in the humanities.
-