Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts
in einer nachhaltigen CLARIN-D-Infrastruktur
Kurationsprojekt 1 der Facharbeitsgruppe 1 Deutsche Philologie
Seit September 2012 wird das Kurationsprojekt „Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts in einer nachhaltigen CLARIN-Infrastruktur“ vom Deutschen Textarchiv (DTA) an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) koordiniert. Bis einschließlich Februar 2014 arbeiten neben der BBAW die Herzog August Bibliothek Wolfenbüttel (HAB), die Justus-Liebig-Universität Gießen (JLU) und das Institut für Deutsche Sprache (IDS) gemeinsam an dem Projekt, das aus der Facharbeitsgruppe 1 Deutsche Philologie des Infrastrukturprojekts CLARIN-D (Common Language Resources and Technology Infrastructure – Deutschland) hervorgeht.
Das Kurationsprojekt „Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts in einer nachhaltigen CLARIN-Infrastruktur“ wird im Rahmen des CLARIN-D-Projekts durch das BMBF gefördert.
Zielsetzung
Mit dem Kurationsprojekt soll der gegenwärtige Status quo des nur unzureichend vorhandenen sowie heterogenen Inventars an Textkorpora für das Frühneuhochdeutsche (14.−17. Jh.) und für die älteren Stadien des Neuhochdeutschen (17.−19. Jh.) verbessert werden. Die bestehenden Korpora sind unübersichtlich und systematisch nur schwer zu erschließen. Diese Lage ist durch zwei gegenläufige Befunde zu charakterisieren, einerseits durch das Fehlen von integrierten Korpusressourcen für das 15.−19. Jahrhundert, andererseits durch die Vielfalt der Vorlagen, der Transkriptionsrichtlinien und der Publikationsformate der verstreut vorhandenen Ressourcen unterschiedlicher Qualität für dieses Sprachstadium.
Ziel des Projekts ist die kriteriengestützte Auswahl von Volltexten anhand einer Bewertungsmatrix und die Integration von für geeignet befundenen Ressourcen in die Korpora des Deutschen Textarchiv und der Wolfenbütteler Digitalen Bibliothek.
Mit einem umfangreichen, homogen strukturierten und nachhaltig nutzbaren Volltextkorpus für deutschsprachige Texte des 15. bis 19. Jahrhunderts sollen die Forschungsbedingungen – beispielsweise für die historische Linguistik – optimiert werden und der Erkenntnisgewinn erweitert werden. Als Projektziel war eine Integration von insgesamt mindestens 35000 Druckseiten vorgesehen. Diese im Projektplan angestrebte Zahl wurde sogar überschritten, es ist dabei allerdings zu bedenken, dass „Kuration“ auch weitere Arbeit und Pflege an den Texten beinhaltet, die erst nach der Integration in die Qualitätssicherungsumgebung DTAQ des Deutschen Textarchivs erfolgt. Dort besteht die Möglichkeit, die Texte kollaborativ nachzubearbeiten und zu korrigieren. Durch die gemeinsame Arbeit und Pflege der Ressourcen soll die Kultur des Crowdsourcing stärker als bisher in der germanistischen Fachgemeinschaft etabliert werden.
Die geplante Infrastruktur soll nicht zuletzt auch die Langzeitarchivierung der historischen Textquellen in einem zentralen Repositorium garantieren.
Die bisher kuratierten Texte sowie Informationen zu Textquellen und bestehenden Kooperationen finden Sie unter „Texte“.
Mehr Informationen zur Aufbereitung der Texte finden Sie unter „Dokumentation“.
Beteiligte Institutionen
- Berlin-Brandenburgische Akademie der Wissenschaften
- Justus-Liebig-Universität Gießen
- Herzog August Bibliothek Wolfenbüttel
- Institut für Deutsche Sprache Mannheim
Projektkoordination: BBAW
Ausführlicheres zu Antragstellern und Mitarbeitern finden sie unter „Projektgruppe“.
Stand des Projekts (November 2024)
695 | Werke |
112 093 | Seiten |
36 647 006 | Tokens |
244 926 894 | Zeichen |
Stöbern
- Editionen
- Max-Planck-Gesellschaft
- Projekt Gutenberg-DE
- Project Gutenberg.org
- Wikisource
- Wolfenbütteler Digitale Bibliothek
- zeno.org / Textgrid
- diGItexte
- Sonstige
- nach Veröffentlichungszeit
- nach Textgattung/-kategorien
Stand dieser Seite: Mon Jan 27 17:36:14 2014