Grundsätzliches zur Transkription
Die Texterfassung erfolgt grundsätzlich vorlagengetreu im Unicode-Format (Kodierung in UTF-8) des zum Zeitpunkt der Erfassung gültigen Unicode-Standards. Dabei werden die Zeichen, wenn möglich, hinsichtlich ihrer Semantik abgebildet.
Auf modernisierende Veränderungen des lexikalischen Materials wird in der Regel verzichtet, z. B. auch in Bezug auf die Schreibung von Eigennamen. Auch Druckfehler werden übernommen (zum Verfahren der Druckfehlerannotation siehe das entsprechende Kapitel im DTA-Basisformat).
Leerzeichen werden grundsätzlich der Vorlage gemäß gesetzt; sie sind in der Kodierung niemals implizit. Ausnahmen bilden Leerzeichen im Zusammenhang mit Satzzeichen (s. die entsprechenden Regeln zur Erfassung von Satzzeichen) sowie Weißraum (s. die entsprechenden Regeln zu Einrückungen und horizontalem/vertikalem Leerraum).
Zur Behandlung von unleserlichen bzw. schwer entzifferbaren Zeichen siehe das entsprechende Kapitel im DTA-Basisformat.
Ausnahmen und Abweichungen von diesen Grundregeln werden ausführlich in diesem Dokument besprochen.