Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Hilfe

1  DTA-Leitlinien

Ziel des Deutschen Textarchivs (DTA) ist die Erstellung eines disziplinenübergreifenden Volltextkorpus deutschsprachiger Texte. Grundlage hierfür bilden digitale Faksimiles historischer Druckwerke (Entstehungszeit der Drucke zwischen ca. 1600 und 1900). Das Korpus umfasst Werke verschiedener Textsorten, literarischer Gattungen und wissenschaftlicher Disziplinen. Ziel des Projekts ist die Bereitstellung und – aufgrund der großen Textmenge weitestgehend automatische – linguistische Aufbereitung eines vielseitigen, umfangreichen Textbestandes auf dieser heterogenen Grundlage.

DTA-Leitlinien anschauen …

2  DTA-Richtlinien zur Texterfassung

Die Erfassung der Texte im DTA erfolgt nach dem Prinzip der Wahrung des historischen Sprachstandes der Texte. Aufgrund dieser Zielsetzung wird darauf geachtet, bei der Texterfassung die Zahl der (unvermeidbaren) Interpretationen typographischer Gegebenheiten gering zu halten. Um unbewusste Modernisierungen oder Korrekturen zu vermeiden, werden die Texte von Nicht-Muttersprachlern eingegeben. Eine Druckfehlerkorrektur erfolgt daher während der Erfassung nicht, kann aber im Erschließungs- und Korrekturprozess eingeschränkt vorgenommen werden.

DTA-Richtlinien zur Texterfassung anschauen …

3  DTA-Basisformat

Das DTA-Basisformat soll im Rahmen der DTA-Richtlinien eine uneingeschränkte Textaufbereitung ermöglichen und dabei gleichzeitig Variationsspielräume bei der Annotation so einschränken, dass die Kohärenz der DTA-Texte untereinander gewährleistet wird. Für dieses Ziel stellt die Ausrichtung des DTA-Korpus in der Diachronie einerseits und die Textsortenvielfalt andererseits eine große Herausforderung dar, resultiert sie doch u. a. in einer strukturellen Variabilität der Vorlagen, der mit dem vorliegenden Annotationstagset Genüge getan werden muss.

DTA-Basisformat anschauen …

4  Korrekturfibel

Mit der Korrekturumgebung des Deutschen Textarchivs können Sie Stellen zur Korrektur kennzeichnen bzw. vorschlagen. Die Korrekturen werden von Mitarbeitern des DTA geprüft und anschließend vorgenommen. Die Durchsicht von Texten kann sehr anstrengend und monoton sein. Sie müssen den Text nicht vollständig durchsehen, sondern können verschiedene Arten der Korrektur wählen.

Korrekturfibel anschauen …

5  Darstellungsprobleme

Wenn Zeichen nicht korrekt dargestellt werden (beispielsweise als Kästchen), dann hilft es, einen Unicode-Font zu installieren:

Wenn Sie keinen Unicode-Font installieren können/wollen oder die Darstellung auch nach dessen Installation noch verzerrt sein sollte, können Sie entsprechende Einstellungen in Ihrem Profil vornehmen.

6  Browserunterstützung

Die Korrekturumgebung sollte mit allen modernen Browsern funktionieren. Beachten Sie bitte, dass der Internet Explorer von Microsoft deshalb nur eingeschränkt nutzbar ist.

7  Ansichten

Folgende verschiedene Ansichten können ausgewählt werden:

  • Korrekturumgebung
    • Text: formatierte zeilengenaue Textansicht
    • XML: nach TEI/P5 annotierter Text
    • CAB: Text in automatisch modernisierter Schreibweise
      CAB (Cascaded Analysis Broker) ist ein Programm zur fehlertoleranten linguistischen Analyse historischer Texte. CAB führt ein Wort in historischer Orthographie (z. B. „Theyl“ für „Teil“) zunächst auf seine phonetische Entsprechung zurück (Letter-To-Sound-Reduktion, LTS), um von dort aus alle möglichen Schreibweisen des Wortes zu rekonstruieren (z. B. auch „Thayl“, „Teyl“ usw.) und suchbar zu machen. (Siehe auch die ausführlichen Informationen zur linguistischen Analyse historischer Texte mit CAB.
    • Part-Of-Speech: Das vom DTA verwendete Tagset basiert auf dem „Stuttgart/Tübinger Tagset“ (STTS), das von Anne Schiller, Christine Thielen, Simone Teufel und Christine Stöckert entwickelt wurde, siehe Part-of-Speech-Tagging im Deutschen Textarchiv.
    • semantisch ähnliche Seiten: Aus dem Bestand des DTA werden semantisch ähnliche Seiten ermittelt und als Link zur ermittelten Dokumentseite zur Verfügung gestellt.
    • Funktionen für Arbeitsgruppen und Projekte
      • Instant Editor: Fehler in der Textgrundlage können direkt und ohne XML-Kenntnisse mit dem Instant-Editor in der Text-Bild-Ansicht korrigiert werden.
      • XML-Editor: Das Bearbeiten und Korrigieren der XML-Annotationen ist über den integrierten Editor möglich.
      • Versionen: Alle Änderungen werden in einem git-Repository hinterlegt und zeichnen so die digitale Genese der Korrekturvorgänge auf. Über Versionen haben Sie den Zugriff auf die einzelnen Bearbeitungsphasen.
  • Lesefassung: parametrisierbare Textansicht zum Lesen am Bildschirm

8  Tastaturkürzel

Folgende Tastaturkürzel stehen Ihnen innerhalb der Korrekturumgebung zur Verfügung:

Firefox Chrome, Safari Opera Internet Explorer Funktion
NNNN nächste Seite im Buch
PPPP vorhergehende Seite im Buch
RRRR Zufallsseite
BBBB zufälliges Buch
IIII neues Ticket
HHHH Ansicht: HTML
XXXX Ansicht: XML
TTTT Ansicht: Text
CCCC Ansicht: CAB

Stand dieser Seite: Tue Jan 12 11:47:40 2016