Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Wortwolke – Lemmata, Nomen

Humboldt, Alexander von: Auszüge aus einem im Jahre 1844 in Berlin zum Besten des Luisenstifts verfaßten Kunst-Albums [...]. In: Dresdner Album. Zur Unterstützung der Nothleidenden im sächsischen Erzgebirge, im Voigtlande und in den Weberdörfern der Oberlausitz. Dresden, 1847, S. 145-146.

Diese Wortwolke basiert auf dem automatischen Lemmatisierungsverfahren historischer Texte (CAB), das im DTA für die Textsuche angewandt wird. Die Lemmatisierung fasst sowohl Transliterationen (also bspw. ſ → s) als auch grammatische Formen (Teil, Theil, Theile, Theiles, ...) zusammen. Die Wortidentifikation (Tokenisierung) erfolgt mittels DTA-Tokwrap. Die Fontgröße der einzelnen Lemmata in der Wortwolke ist proportional zu deren Frequenz im Dokument. Lemmata, die im Dokument weniger als dreimal vorkommen, werden nicht dargestellt. Es werden nur diejenigen Lemmata dargestellt, die vom Part-of-Speech-Tagger als Substantiv (Klasse NN) klassifiziert werden.


Dieses Werk hat einen zu geringen Umfang, um eine Wortwolke daraus zu erstellen.