Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D


Deutsches Textarchiv

Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis 1900 bereit. Die Textauswahl erfolgte auf der Grundlage einer von Akademiemitgliedern erstellten und ausführlich kommentierten, umfangreichen Bibliographie. In Ergänzung wurden einschlägige Literaturgeschichten und (Fach-)Bibliographien ausgewertet. Aus der Gesamtliste der auf diesem Wege ermittelten Titel wurde von der DTA-Projektgruppe ein hinsichtlich der repräsentierten Textsorten und Disziplinen ausgewogenes Korpus zusammengestellt (weitere Informationen zur Textauswahl).

Um den historischen Sprachstand möglichst genau abzubilden, werden als Vorlage für die Digitalisierung in der Regel die Erstausgaben der Werke zugrunde gelegt. Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung.    mehr …


Neuigkeiten aus dem Projekt

Blog: Im Zentrum Sprache

hypotheses.org Logo Auf der Plattform hypotheses.org präsentieren die Projekte Deutsches Textarchiv, DWDS und CLARIN-D Neuigkeiten aus der Forschung an, mit und über Korpusressourcen, Werkzeuge und Formate, die im Zentrum Sprache der BBAW erstellt und gepflegt werden. MitarbeiterInnen des Zentrums sowie externe Beiträger berichten dabei praxisnah über neue Projekte oder interessante Einzelbefunde und berichten über Workshops und Konferenzen. Unser neues Blog „Im Zentrum Sprache“ finden Sie unter sprache.hypotheses.org.   mehr …

 

Vortrag von Susanne Haaf im Rahmen des DH-Kolloquiums an der BBAW (1.9.2017)

BBAW LogoAm 1.9.2017 fand bereits zum dritten Mal das monatliche „Digital-Humanities-Kolloquium“ an der BBAW statt, bei dem diesmal Susanne Haaf einen Vortrag über das DTA-Basisformat zur TEI-XML-konformen Annotation historischer Textressourcen hielt. Die Folien zum Vortrag „Das DTA-Basisformat zur TEI-XML-konformen Annotation historischer Textressourcen“ von Susanne Haaf finden Sie sowohl auf den Seiten des DTA als auch (in Kürze) auf dem edoc-Server der BBAW.   mehr …

 

DTABf, ediarum und Deutsches Textarchiv auf dem Workshop zum Thema "Editionsportale" in Jena vorgestellt

DH-Net_Jena Am 3. August 2017 waren das Deutsche Textarchiv und die Telota-Initiative der BBAW mit einem gemeinsamen Vortrag auf dem Workshop des Editionsportals Thüringen vertreten.   mehr …

 

Weitere Nachrichten finden Sie im News-Archiv.

Das DTA in Zahlen

3 282Werke
628 719digitalisierte Seiten
154 748 503fortlaufende Wortformen
1 080 549 263Zeichen (Unicode)
1031weitere Werke in DTAQ

Das DTA am 20. November 2017


Nachweis: Bundesarchiv, Bild 183-U0226-501 / CC-BY-SA
Am 20. November 1906 wurde Frank Wedekinds Drama „Frühlings Erwachen“ an den Berliner Kammerspielen unter der Regie von Max Reinhardt uraufgeführt.

Neue Werke im DTA




alle Titel …    

Stöbern im DTA

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.