|
Download
Übersicht
DTA-Korpora
Alle zum Download bereitgestellten Texte sind im DTA-Basisformat, einem TEI/P5-XML-Subset, ausgezeichnet.
- Version vom 13. Mai 2021:
- DTA-Kernkorpus
- gesamt: Download als ZIP-Datei (1478 Texte, 361M, MD5: 45a74b2e312d8dea556678d3031a7d03).
- Textkategorie Belletristik: Download als ZIP-Datei (553 Texte, 92M, MD5: a81a6c663e966791903cdadd42e41a4d).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (266 Texte, 71M, MD5: 2e1e6bb18746390758e3d21f1bf120af).
- Textkategorie Wissenschaft: Download als ZIP-Datei (659 Texte, 199M, MD5: 47475289fd3ff786599c591b0a54f095).
- Zeitraum 1600–1699: Download als ZIP-Datei (237 Texte, 60M, MD5: ddcb985e44998580e61e357c68000d04).
- Zeitraum 1700–1799: Download als ZIP-Datei (529 Texte, 123M, MD5: 6744b79b6325994f3bc5d48943a93ab6).
- Zeitraum 1800–1899: Download als ZIP-Datei (692 Texte, 168M, MD5: 71f81d1d71d8037857fc5d64d46851f6).
- DTA-Kernkorpus und Ergänzungstexte
- gesamt: Download als ZIP-Datei (4436 Texte, 537M, MD5: 2a16acadd2a77b326684f72adf60677d).
- Textkategorie Belletristik: Download als ZIP-Datei (769 Texte, 116M, MD5: 9dadd1ab08c98765410aabd9791c05b3).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (1407 Texte, 140M, MD5: 8497e74ca63cc135f3e06369c2be4bac).
- Textkategorie Wissenschaft: Download als ZIP-Datei (943 Texte, 240M, MD5: 6a8a5726fbc76939135b3a815a5fad9b).
- Textkategorie Zeitung: Download als ZIP-Datei (1317 Texte, 42M, MD5: 61d7b59d60eb0455ba295ca0a26c6f71).
- Zeitraum 1600–1699: Download als ZIP-Datei (771 Texte, 89M, MD5: 18e68c8652c7a98ebc128373ce3c440f).
- Zeitraum 1700–1799: Download als ZIP-Datei (893 Texte, 149M, MD5: 51c94ad4e37a76f9f9ef79023b11dad5).
- Zeitraum 1800–1899: Download als ZIP-Datei (1996 Texte, 256M, MD5: 31c28cefd88219bade90fc2eacc8601f).
- Version vom 27. Juli 2020:
- Version vom 20. Juli 2020:
- DTA-Kernkorpus
- gesamt: Download als ZIP-Datei (1472 Texte, 359M, MD5: 51f8a87f7db1933b52b5b72d5f44d749).
- Textkategorie Belletristik: Download als ZIP-Datei (552 Texte, 92M, MD5: bbff29355dca02be6013a353e52df6e3).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (266 Texte, 71M, MD5: 3a280d62af058454ce503efaf44f8999).
- Textkategorie Wissenschaft: Download als ZIP-Datei (654 Texte, 198M, MD5: a19703223d5f893bc23337f76191aaef).
- Zeitraum 1600–1699: Download als ZIP-Datei (237 Texte, 60M, MD5: 7fe8c440893a2ef5fbe9b5ef18c0d9e8).
- Zeitraum 1700–1799: Download als ZIP-Datei (526 Texte, 122M, MD5: 891d5bfe723a53f9318e3cdf7c985291).
- Zeitraum 1800–1899: Download als ZIP-Datei (689 Texte, 167M, MD5: fe74a406b19ab30615644734769f1420).
- DTA-Kernkorpus und Ergänzungstexte
- gesamt: Download als ZIP-Datei (4174 Texte, 482M, MD5: a366980279da42b1fc7100df6eeb799b).
- Textkategorie Belletristik: Download als ZIP-Datei (765 Texte, 116M, MD5: a69770d193cf64cae2f67153d2374c7b).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (1121 Texte, 97M, MD5: d58736cb25674eba9a5b1b101edfe023).
- Textkategorie Wissenschaft: Download als ZIP-Datei (843 Texte, 230M, MD5: 493753be6a402ac7bfa586b9fa769ab0).
- Textkategorie Zeitung: Download als ZIP-Datei (1315 Texte, 40M, MD5: 9072b66712df79eb126da92723e5eeeb).
- Zeitraum 1600–1699: Download als ZIP-Datei (685 Texte, 76M, MD5: f4bdb7808831c18c0f23254ec94ae7e3).
- Zeitraum 1700–1799: Download als ZIP-Datei (842 Texte, 139M, MD5: b92bf9d90971ab4ab6bbf8e2954ef632).
- Zeitraum 1800–1899: Download als ZIP-Datei (1967 Texte, 233M, MD5: efaaef71406cef3db62fcf59f7b17994).
- Version vom 14. Januar 2020:
- DTA-Kernkorpus
- gesamt: Download als ZIP-Datei (1472 Texte, 359M, MD5: 126ae65c7f6b86a8ed9cf9c2fda2203a).
- Textkategorie Belletristik: Download als ZIP-Datei (552 Texte, 92M, MD5: 0477b66dea154227d3a065fa43a92f53).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (266 Texte, 71M, MD5: 9ac573f344eb68f5318d18c24b4c6778).
- Textkategorie Wissenschaft: Download als ZIP-Datei (654 Texte, 198M, MD5: be34da50088818faf55731dc5e487975).
- Zeitraum 1600–1699: Download als ZIP-Datei (237 Texte, 60M, MD5: e64c95d795069006ce6832402ac88efb).
- Zeitraum 1700–1799: Download als ZIP-Datei (526 Texte, 122M, MD5: a23944b86dc12a239f87472b4f108aed).
- Zeitraum 1800–1899: Download als ZIP-Datei (689 Texte, 167M, MD5: 585dcb921c412c611eaf096ee7ba19cf).
- DTA-Kernkorpus und Ergänzungstexte
- gesamt: Download als ZIP-Datei (4160 Texte, 480M, MD5: ee96b18cee278933b4f4cd08d0dc4099).
- Textkategorie Belletristik: Download als ZIP-Datei (759 Texte, 115M, MD5: 8982525b8226efeb779737a8213b83e2).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (1113 Texte, 95M, MD5: 4b689a348d13a06c6021824a13359abc).
- Textkategorie Wissenschaft: Download als ZIP-Datei (842 Texte, 230M, MD5: 9cc1d176f7213e3488f29415e9f921fd).
- Textkategorie Zeitung: Download als ZIP-Datei (1315 Texte, 40M, MD5: 86ec7ea0d40f43532e17a0d7348a164e).
- Zeitraum 1600–1699: Download als ZIP-Datei (685 Texte, 76M, MD5: 73adfd6756b25fd72eb3d7645b8f8b9a).
- Zeitraum 1700–1799: Download als ZIP-Datei (840 Texte, 138M, MD5: e2f25261427564b6c472a2b32bfc0624).
- Zeitraum 1800–1899: Download als ZIP-Datei (1961 Texte, 232M, MD5: cb19decd16c599abdf8ff2c7b3ed3218).
- Version vom 5. Juni 2019:
- DTA-Kernkorpus
- gesamt: Download als ZIP-Datei (1406 Texte, 347M, MD5: 44c482e3dbb68bc0ce60314e17ec2c0e).
- Textkategorie Belletristik: Download als ZIP-Datei (523 Texte, 89M, MD5: 22ac961949d10db6f0b8c0b390aa3472).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (248 Texte, 66M, MD5: d78f056d39a475689c9aaa725b693d79).
- Textkategorie Wissenschaft: Download als ZIP-Datei (635 Texte, 194M, MD5: 137c5a591f21e420e2c68abcfddc4b42).
- Zeitraum 1600–1699: Download als ZIP-Datei (223 Texte, 58M, MD5: 57260ae1476f6dfce998360ac52e31be).
- Zeitraum 1700–1799: Download als ZIP-Datei (504 Texte, 119M, MD5: 80bf3a34eae5bf92c09a6e7dd4256ba1).
- Zeitraum 1800–1899: Download als ZIP-Datei (659 Texte, 161M, MD5: f4f19ac633a37e7e83271273d8923ef3).
- DTA-Kernkorpus und Ergänzungstexte
- gesamt: Download als ZIP-Datei (3888 Texte, 455M, MD5: 090d788209e8a64922415132b973647a).
- Textkategorie Belletristik: Download als ZIP-Datei (717 Texte, 107M, MD5: 0f0dcb68fa61274d44c1bf34956177d2).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (1130 Texte, 98M, MD5: bfbc8700f17e7925f2f163c6b115973c).
- Textkategorie Wissenschaft: Download als ZIP-Datei (807 Texte, 220M, MD5: 836c9e8e4ec70c949bfbe9a2dc8cec7d).
- Textkategorie Zeitung: Download als ZIP-Datei (1103 Texte, 30M, MD5: 4cfb998c22cb715bf6554c7c062f6ac4).
- Zeitraum 1600–1699: Download als ZIP-Datei (670 Texte, 74M, MD5: 2104348d9f450204db38e9ecf002b7ad).
- Zeitraum 1700–1799: Download als ZIP-Datei (809 Texte, 131M, MD5: ebff1b932c5ebff451f4f828ff5baf96).
- Zeitraum 1800–1899: Download als ZIP-Datei (1741 Texte, 217M, MD5: badf133dbdc92377735f525671f70229).
- Version vom 6. Februar 2019:
- Version vom 17. Oktober 2018:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 23. Februar 2018:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 12. Oktober 2017:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 21. Juli 2017:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 11. Oktober 2016:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 11. Februar 2016:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 4. Februar 2016:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- Version vom 10. März 2014:
- DTA-Kernkorpus.
- DTA-Kernkorpus und Ergänzungstexte.
- Version vom 6. November 2013:
TCF-Versionen
- TCF-Version vom 19. Oktober 2021:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- TCF-Version vom 14. Januar 2020:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- TCF-Version vom 18. Oktober 2018:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
- TCF-Version vom 1. September 2017:
-
DTA-Kernkorpus (in den Formaten „TCF text annotation layer“ und „TCF tokenisiert, serialisiert, lemmatisiert, normalisiert“)
-
DTA-Kernkorpus und Ergänzungstexte (in den Formaten „TCF text annotation layer“ und „TCF tokenisiert, serialisiert, lemmatisiert, normalisiert“)
-
nach Textklassen gruppiert und im Format „TCF text annotation layer“
- TCF-Version vom 11. Mai 2016:
- DTA-Kernkorpus
- DTA-Kernkorpus und Ergänzungstexte
Reintext-Versionen
Die Reintext-Versionen enthalten keine Metadaten. Bitte beachten Sie, dass der
Textfluss in den Dateien nicht dem im Original entsprechen muss. Die Worttrennung
am Zeilenende in den Textdateien ist aufgelöst. Außerdem sind
folgende Informationen nicht in den Dokumenten enthalten (falls im Original
ausgezeichnet):
- Seiten- und Zeilenzahlen
- Kolumnentitel, Bogensignaturen, Kustoden
DTA-Kernkorpus, Version vom 2020-10-23
lemmatisiert
normalisiert
Originaltext
transliteriert
DTA-Erweiterungstexte: Version vom 2020-10-23
lemmatisiert
normalisiert
Originaltext
transliteriert
- Version vom 23. September 2020:
- DTA-Kernkorpus
- gesamt: Download als ZIP-Datei (1472 Texte, 313M, MD5: 753307a72360810cf9a6813d674aca94).
- Textkategorie Belletristik: Download als ZIP-Datei (552 Texte, 81M, MD5: 554dbb98f492f35a192f3a32d4210bbe).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (266 Texte, 61M, MD5: ec702bc67f3d7ee6d7d7213c14fc1124).
- Textkategorie Wissenschaft: Download als ZIP-Datei (654 Texte, 172M, MD5: c3c29e6da192a7c217bd1f725ac41547).
- Zeitraum 1600–1699: Download als ZIP-Datei (237 Texte, 52M, MD5: e51dc308c5b660716667076504154679).
- Zeitraum 1700–1799: Download als ZIP-Datei (526 Texte, 104M, MD5: 632359078f0d3e4de385685bccc43cda).
- Zeitraum 1800–1899: Download als ZIP-Datei (689 Texte, 148M, MD5: fe6de0d92844c2177bb3a8e4e611bbb3).
- DTA-Kernkorpus und Ergänzungstexte
- gesamt: Download als ZIP-Datei (4189 Texte, 436M, MD5: 17d24232b78b41d28b317203a6813ddb).
- Textkategorie Belletristik: Download als ZIP-Datei (766 Texte, 101M, MD5: 14b6fd0335ae6696990d501488d9fa52).
- Textkategorie Gebrauchsliteratur: Download als ZIP-Datei (1196 Texte, 103M, MD5: 07314287ca4f37ef4cdea1cd602aec3e).
- Textkategorie Wissenschaft: Download als ZIP-Datei (910 Texte, 199M, MD5: 033bd2c8f3f0c0fb46be565c9603c94f).
- Textkategorie Zeitung: Download als ZIP-Datei (1315 Texte, 33M, MD5: 21b89cc9dcecc167d4cd4df546e24b74).
- Zeitraum 1600–1699: Download als ZIP-Datei (685 Texte, 64M, MD5: 2f770edbc869959879d388648af28cbf).
- Zeitraum 1700–1799: Download als ZIP-Datei (842 Texte, 118M, MD5: 4c57d45c8bd1b45c1070c97e1b13d02e).
- Zeitraum 1800–1899: Download als ZIP-Datei (1979 Texte, 224M, MD5: 6dff270258477890847cc49e116c90db).
Texte aus dem OCR-Workflow
In der ersten Projektphase des DTA (2007–2010) wurden 199 Texte durch OCR erfasst und anschließend nachkorrigiert. Für diese Werke liegen TEI/P5-Daten vor, die für jedes einzelne Zeichen die entsprechenden Koordinaten für die Position des Zeichens auf dem zugrundeliegenden Faksimilebild haben. Da sich herausgestellt hat, dass die Arbeit an diesen Daten sehr mühselig ist, und das DTA seinen Fokus auf die Textdaten legt, und die Verknüpfung zu den Faksimiledaten über die Seitenzuordnung ausreichend ist, werden diese Daten nicht mehr gepflegt. An dieser Stelle stellen wir diese Daten zur Verfügung.
|
|