Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

DTA-Erweiterungen (DTAE): Transkription und Annotation mit oXygen oder Microsoft Word

1  Transkription und XML-Annotation mit oXygen

Da Sie im Zuge der Transkription mit Hilfe von XML-Annotationen Merkmale des Textes festhalten möchten, bietet sich ein XML-Editor als Transkriptionswerkzeug an. DTAE stellt Ihnen dafür ein oXygen-Framework bereit. Die Autor-Umgebung des oXygen-XML-Editors kann ähnlich wie Microsoft Word verwendet werden. Vorteil dieser Variante ist: Sie haben die Übersicht über alle verfügbaren und verwendeten DTA-Annotationen.

Mit dem speziellen Menüpunkt DTAE und der DTAE-Werkzeugleiste stehen Ihnen die am häufigsten verwendeten Annotationen übersichtlich zur Verfügung.

Das Framework unterstützt zwei verschiedene Level der Annotation:

Weitere Informationen zum DTA-oXygen-Framework und Download.

2  Hinweise zur Transkription und Annotation mit Microsoft Word

Für die Erstellung XML-annotierter Volltexte bietet es sich an, einen XML-Editor zu benutzen. Sollten Sie es dennoch vorziehen, das Textverarbeitungsprogramm Microsoft Word zur Transkription Ihrer Texte zu verwenden, beachten Sie bitte die folgenden Hinweise.

Der Text sollte zeilengenau transkribiert werden. Zeilenumbrüche innerhalb eines Absatzes sind als manuelle Zeilenumbrüche einzugeben (drücken Sie dazu die Tastenkombination UMSCHALT+EINGABETASTE, um einen manuellen Zeilenumbruch zu erreichen.) Absätze müssen durch die verwendete Absatzformatvorlage bzw. durch das Absatzendezeichen erkennbar sein. Umbruch- und Absatzmarken können Sie sich in Microsoft Word anzeigen lassen (siehe dazu in Word unter Hilfe das Kapitel „Ein- oder Ausblenden von Formatierungszeichen“).

Die originale Seitenaufteilung wird ebenfalls festgehalten, wobei sowohl die in den Texten vorhandenen als auch die in der Transkription rekonstruierten Seitennummerierungen mittels der Formatvorlage „Seitenzahl-Original“ dokumentiert werden. (Zusätzlich kann eine Annotation mit <pb n="[Seitenzahl]"/> vorgenommen werden.)

Die Graphie der Vorlage sollte in der Transkription übernommen werden. Auf Normalisierungen sollte verzichtet werden (siehe die ausführlichen DTA-Richtlinien zur Texterfassung). Dies betrifft zum Beispiel Umlaute, die gegebenenfalls entsprechend der Vorlage als Vokal mit übergestelltem e übertragen werden sollten. Sie können dazu die entsprechenden Unicode-Kodierungen verwenden. Beachten Sie, dass Sie einen Unicode-konformen Font benutzen müssen, um die Sonderzeichen anzeigen zu können. Alternativ können Sie einfache Entitäten nutzen, die Sie jedoch genau dokumentieren sollten. Denkbar sind zum Beispiel die folgenden Entitäten:

langes s &ss;
rundes s &sr;
e über a &ae;
e über A &Ae;
rundes r &rr;

Für die strukturelle Auszeichnung steht Ihnen eine DTA-Anpassung für Microsoft Word zur Verfügung. Falls Sie diese Variante nutzen möchten, kontaktieren Sie uns.

Stand dieser Seite: Fri Jun 27 15:21:24 2014