Project

Back to overview

Schweizer Text Korpus - Ein Projekt im Rahmen des Digitalen Wörterbuchs der deutschen Sprache des 20. Jahrhundert (DWDS)

Applicant Häcki Buhofer Annelies
Number 114153
Funding scheme Project funding (Div. I-III)
Research institution Deutsches Seminar Universität Basel
Institution of higher education University of Basel - BS
Main discipline German and English languages and literature
Start/End 01.10.2006 - 30.04.2009
Approved amount 717'166.00
Show all

Keywords (8)

Lexikographie; Computerlinguistik; Korpuslinguistik; Gegenwartssprache; Variationslinguistik; Digitalisierung; Textdigitalisierung; Retrodigitalisierung

Lay Summary (German)

Lead
Lay summary
Das Projekt SCHWEIZER TEXT KORPUS (www.schweizer-textkorpus.ch) ist Teil eines internationalen Forschungsvorhabens, welches das Ziel verfolgt, die deutsche Standardsprache des 20. Jahrhunderts ausgewogen zu erfassen und online zugänglich zu machen, indem deutschsprachige Texte aller Art (überwiegend gedruckt, z.T. Typoskripte) digitalisiert werden (Zeitungsartikel, Werbung, Formulare, Anleitungen, Ratgeber, populäre Fachliteratur, Jugend- und Trivialliteratur, Belletristik, Materialien aus Archiven etc.). Das so entstehende digitale Textkorpus soll einerseits zu einem integralen Bestandteil der seit längerem in Deutschland und Österreich tätigen Partnerprojekte werden (www.dwds.de, www.aac.at), andererseits als Grundlage für spezifische schweizerische sprachwissenschaftliche Bedürfnisse im Allgemeinen und für lexikografische Fragestellungen im Besonderen dienen. Darüber hinaus soll Fachleuten und der Öffentlichkeit ein Querschnitt durch die deutsche Standardsprache in der Schweiz im 20. Jh. geboten werden, der auch im Kontext allgemeiner kulturwissenschaftlicher Fragestellungen von Interesse sein wird.Die erarbeiteten digitalen Textbestände sollen im Web mit umfangreichen Volltext-Suchmöglichkeiten (inklusive der Suche nach textstrukturellen Merkmalen, Lemmata, Morphologie und Wortarten (POS) und differenzierten Ausgabemöglichkeiten (Konkordanzen (KWIC), Darstellung von Originaldokumenten (als PDF-Dateien)) dem interessierten Publikum zur Nutzung angeboten werden. Mittelfristig (2008) werden 20 Mio. Textwörter angestrebt. Langfristig ist eine Vervielfachung dieses Textvolumens wünschenswert.Innovativ am Projekt ist sind Fokussierung auf die Deutschschweizer Sprachsituation, die konsequente historische Schichtung und thematische Fächerung des Korpus durch ein ganzes Jahrhundert hindurch, der Einbezug von Archivmaterialien, grauer Literatur und relativ hohe Gewichtung von bisher kaum in Korpora integrierten Textsorten und schliesslich die geplante flexible Darstellungsweise inklusive der Möglichkeit, Seiten von Originaldokumenten als Bilder auszugeben.Methodisch lehnt sich das Projekt an gängige Vorgehensweisen und Techniken in der Korpuslinguistik an. Technisch es setzt auf etablierte Standards für die Textauszeichnung (TEI), anerkannte Formate (XML, PDF) und quelloffene Software für die Umsetzung (XAIRA, PHP u.A.), um eine hohe Portabilität und Kontinuität zu gewährleisten.
Direct link to Lay Summary Last update: 21.02.2013

Responsible applicant and co-applicants

Employees

Associated projects

Number Title Start Funding scheme
140718 Wörterbuch der festen Wendungen und Wortverbindungen der deutschen Sprache 01.04.2012 Project funding (Div. I-III)
103821 Digitales Wörterbuch der deutschen Sprache (DWDS) 01.10.2004 Project funding (Div. I-III)
124582 Wörterbuch der festen Wendungen und Wortverbindungen der deutschen Sprache 01.04.2009 Project funding (Div. I-III)
129577 Deutsche Sprichwörter und Redewendungen im Sprachwandel. Online-Lexikon zur diachronen Phraseologie des Deutschen in neuhochdeutscher Zeit (OLdPhras) 01.04.2010 Project funding (Div. I-III)

-