Die Evolution von komplexen Textmustern t.evo-Logo

Entwicklung und Anwendung eines korpuslinguistischen Analyseverfahrens zur Erfassung der Mehrdimensionalität des Textmusterwandels


Über das Projekt

Das von der DFG geförderte Projekt »Die Evolution von komplexen Textmustern« (t.evo) ging von der Annahme aus, dass Textsorten und Kommunikationsformen einem steten historischen Wandel unterliegen. Sowohl wandelt sich das Spektrum verfügbarer Textsorten als auch ihre Beschaffenheit und der sie konstituierende musterhafte Sprachgebrauch.

Das Erkenntnisinteresse des Projekt t.evo lag dabei in der Frage, welche sprachlichen Muster Textsorten konstituieren, wie sich diese im Netz der (kon)textuellen Dimensionen und Funktionen verorten lassen und inwieweit sie einem Wandel unterliegen.

Die Untersuchungen erfolgten am Beispiel von zwei Textgruppen, der Erbauungsliteratur und der Pressetextsorten, die jeweils in ihrer Zeit Massenmedien bildeten und daher einen breiten Rezipientenkreis aufwiesen. Während die Erbauungsliteratur ihre stärkste Präsenz im 17. und 18. Jh. entfaltete, entfaltete das Zeitungswesen besonders im Verlauf des 19. Jh. seine Wirkungsmacht. Es wurden daher nebeneinander zwei Volltextkorpora aufgebaut — ein erbauliches Korpus des 17./18. Jhs. und ein Zeitungskorpus des 19. und frühen 20. Jhs. — und hinsichtlich der übergeordneten Fragestellung untersucht.

Mit dem Aufbau und der Untersuchung der Volltextkorpora ging auch die umfangreiche manuelle Annotation jeweils eines Teilkorpus von erbaulichen Schriften (Leichenpredigten) und Zeitungen einher, welche im Annotationstool CATMA erfolgte. Das Korpus der manuellen Annotation steht unter der CC BY-SA 4.0-Lizenz zum Download zur Verfügung.


Über die Korpora

Die zugrundeliegenden Korpora konnten teilweise auf Texte, die im Deutschen Textarchiv (DTA) bereits verfügbar waren, zurückgreifen. Zu einem erheblichen Teil erfolgten aber auch im t.evo-Projekt neue Volltextdigitalisierungen entsprechend dem etablierten DTA-Digitalisierungsworkflow. Alle resultierenden Texte sind gemäß dem DTA-Basisformat nach TEI P5 annotiert und stehen über das DTA zur freien Nachnutzung unter einer CC BY-SA 4.0-Lizenz zur Verfügung.

Das Korpus der Erbauungsliteratur

Die Erbauungsliteratur des 17. und 18. Jhs. brachte eine große Zahl an Textsorten hervor. Diese Literatur, die die Stärkung der Christen im Glauben und ihre christliche Orientierung im Leben zum Ziel hatte, umfasste sowohl Gebrauchstextsorten wie Predigten und Andachtsbücher als auch schöngeistige Literatur wie Spruchsammlungen, Lieder und Romane.

Das für das vorliegende Projekt aufgebaute Korpus umfasst erbauliche Gebrauchstextsorten, namentlich Leichenpredigten (i.e. Druckschriften, welche Texte zum Tod einer Person, insbesondere die Grabpredigt, subsummieren), erbauliche Prosaschriften in Form von Andachtsbüchern und geistlichen Traktaten sowie drittens Gebetbücher.

Während das DTA-Kernkorpus im Bereich der erbaulichen Prosaschriften bereits eine nicht unerhebliche Auswahl an Texten bot und das DTA-Erweiterungskorpus mit dem AEDit-Korpus einen herausragenden Bestand an protestantischen Leichenpredigten, v.a. des 17. Jhs., aufweist, waren Gebetbücher noch kaum im DTA vertreten und wurden daher im Rahmen der t.evo-Eigendigitalisierungen verstärkt priorisiert.

Für die Digitalisierungen im Projekt t.evo wurden solche Ergänzungen zum DTA-Bestand gewählt, welche einerseits besonders stark rezipiert und einschlägig waren und welche andererseits hinsichtlich ihrer Publikationsdaten die Streuung von Quellen im Korpus über den Untersuchungszeitraum mit bewirkten.

Für die quantitativen Analysen im Projekt t.evo wurden außerdem Vergleichskorpora aus diversen Textsorten desselben Zeitraums gebildet, für deren Zusammensetzung vollständig auf das DTA-Kernkorpus zurückgegriffen werden konnte.

Das Zeitungskorpus

Für das Zeitungskorpus wurden Ausgaben der Allgemeinen Zeitung aus dem Zeitraum von 1830 bis 1929 digitalisiert. Die (Augsburger) Allgemeine Zeitung eignete sich besonders gut als Korpus im vorliegenden Kontext, da sie als überregional rezipierte Zeitung im deutschsprachigen Raum über den gesamten Zeitraum hinweg regelmäßig erschien. Für das Korpus wurden für Zeitschnitte, die regelmäßig über das Jahrhundert verteilt waren, exemplarisch Ausgaben ausgewählt.

Ergänzt wurden die digitalisierten Zeitungen zum einen durch Ausgaben aus dem zeitlich eng begrenzten Korpus der Allgemeinen Zeitung, welches in den DTA-Erweiterungen (DTAE) bereits enthalten war. Zum anderen konnten aus weiteren DTAE-Zeitungskorpora Vergleichskorpora gebildet werden, namentlich aus dem Mannheimer Korpus historischer Zeitungen und Zeitschriften und dem Korpus zum Hamburgischen Correspondenten.


Ansprechpartner & Kontakt

Weitere Informationen zum Projekt und Publikationen sind über die t.evo-Projekthomepage verfügbar.


Zugriff auf die Korpora

Im Folgenden sind alle Dokumente, die in das t.evo-Korpus einflossen, gelistet und können über die Volltextsuche analysiert sowie im DTA eingesehen werden. Übersichten zu den in den Korpora vorhandenen Dokumenten im PDF-Format sind außerdem über die t.evo-Homepage zugänglich.

Suche

Die Korpusbereitstellung ermöglicht komplexe Suchanfragen (dstar-Schnittstelle) auf Grundlage linguistischer Voranalysen (Lemmatisierung, POS-Tagging, orthographische Normierung), Korpusanalysen mit Wortverlaufskurven und Kollokationsanalysen im zeitlichen Verlauf mit DiaCollo.

Korpuszusammenstellung und Zugriff

Titel Jahr Genre Quelle
Titel Jahr Genre Quelle