Nutzung der DTABf-Dokumentation
Konventionen der Dokumentation
XML-Elemente werden mittels spitzer Klammern als solche gekennzeichnet:
<[Elementname]>
. Sie sind darüber hinaus durch
Nichtproportionalschrift
vom restlichen Text abgesetzt.
Ebenso sind sämtliche Beispiele durch Nichtproportionalschrift
gekennzeichnet. Sie sind zudem jeweils gelb unterlegt.
Umschreibungen für potentielle Inhalte von Elementen oder Werte von Attributen werden durch eckige Klammern dargestellt.
Attribute im Fließtext werden durch ein vorangestelltes @
gekennzeichnet.
Einrückungen in Beispielen dienen lediglich der besseren Anschaulichkeit in der vorliegenden Dokumentation. Sie sind nicht Bestandteil der XML-Dokumente des DTA.
Hinweise zur Dokumentation
Die DTABf-Dokumentation ist in mehrere Dokumente untergliedert:
- Die zentrale Dokumentation der Richtlinien zur Textauszeichnung bilden die Teile Formale Erschließung des Volltextes und Inhaltliche Erschließung des Volltextes. Eine eigene ergänzende Dokumentation ist der Auszeichnung von Zeitungen gewidmet.
- Neben den Richtlinien zur Textauszeichnung umfasst das DTABf Richtlinien zur Strukturierung der Metadaten, welche ebenfalls in einem eigenen Dokument beschrieben sind.
- Tabellarische Übersichten geben einen schnellen Einblick in das Tagset des DTABf für die Textauszeichnung sowie für die Metadaten-Strukturierung.
- Ergänzt wird die DTABf-Dokumentation durch die DTA-Richtlinien zur Texterfassung.
- Eine Vorlagedatei zum DTA-Basisformat, welche die DTABf-Schemas sowie die wichtigsten Elemente enthält, erleichtert den Einstieg in die DTABf-konforme Texterstellung.
Die DTABf-Dokumentation enthält zwei Formen von Beispielen. Zum einen werden die vorgestellten Strukturierungen beispielhaft vorgestellt, wobei die vorgesehenen Elementinhalte in eckigen Klammern umschrieben werden. Zum anderen sollen konkrete Textbeispiele aus dem DTA-Korpus der Veranschaulichung dienen. Sie bestehen jeweils aus einem Bildausschnitt und dem entsprechenden Ausschnitt des zugehörigen strukturierten DTA-Volltexts.