Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Wortwolke – Lemmata

Kafka, Franz: Ein Hungerkünstler. Berlin, 1922.

Diese Wortwolke basiert auf dem automatischen Lemmatisierungsverfahren historischer Texte (CAB), das im DTA für die Textsuche angewandt wird. Die Lemmatisierung fasst sowohl Transliterationen (also bspw. ſ → s) als auch grammatische Formen (Teil, Theil, Theile, Theiles, ...) zusammen. Die Wortidentifikation (Tokenisierung) erfolgt mittels DTA-Tokwrap. Die Fontgröße der einzelnen Lemmata in der Wortwolke ist proportional zu deren Frequenz im Dokument. Lemmata, die im Dokument weniger als dreimal vorkommen, werden nicht dargestellt.