2. DTA- & CLARIN-D-Konferenz und Workshop (#dtaclarin14, @textarchiv)
Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften
17./18. Nov. 2014, BBAW, Berlin
Inhaltsverzeichnis dieses Dokuments
1 Ankündigungstext
Die zweite gemeinsame DTA- und CLARIN-D-Konferenz behandelt Bedeutung, Nutzen
und Möglichkeiten der Nachnutzung von „Textkorpora in Infrastrukturen für die
Geistes- und Sozialwissenschaften“.
In zwei übergeordneten Themenblöcken stellen Wissenschaftlerinnen und Wissenschaftler
verschiedener geistes- und sozialwissenschaftlicher Disziplinen zum einen aktuelle,
korpusgeleitete Forschungsfragen und zum anderen verschiedene Zugriffs- und
Auswertungsmöglichkeiten für Textkorpora vor.
Der erste Themenblock beschäftigt sich mit den Möglichkeiten und den gegenwärtig
noch bestehenden Grenzen korpusbasierter Forschung, um daraus Anforderungen an die
zugrundeliegenden Daten und Infrastrukturen abzuleiten. Derzeit existieren viele
Projekte, die den Aufbau von Textkorpora zum Inhalt haben und dabei von vielfältigen
Erkenntnisinteressen geleitet sind. Die zentralen Aufgaben von Forschungsinfrastrukturen
wie CLARIN bestehen unter anderem darin, solche Korpusressourcen zu sammeln, zu pflegen,
ggf. weiter aufzubereiten sowie Werkzeuge zu deren Auswertung, Be- und Verarbeitung
anzubieten. Auf diese Weise entstehen zunehmend große Textressourcen, welche Antworten
auf neue und innovative Fragestellungen erlauben bzw. denkbar machen. Ein möglichst
breit gefächerter Einblick aus der Perspektive verschiedener Disziplinen in die Arbeit
mit Korpusdaten, mögliche Fragestellungen sowie die daraus sich ergebenden Anforderungen
an die zugrundeliegenden Textkorpora und an Forschungsinfrastrukturen, die diese Korpora
bereitstellen, ist daher von großer Bedeutung für eine breite und divers interessierte
Community.
In einem zweiten Themenblock wird von der praktischen Seite erörtert, wie Text- und Metadaten
projektübergreifend zusammengeführt und im Zusammenhang auswertbar gemacht werden können.
Dabei wird es zum einen um Bemühungen hinsichtlich der Formulierung von Standards, die daraus
sich ergebenden Konsequenzen für die Datenaufbereitung sowie die Sicherung der Konformität der
Daten mit den formulierten Standards gehen. Zum anderen werden bereits implementierte Methoden
vorgestellt, um solcherlei homogen aufbereitete Textkorpora und Metadaten entsprechend datenbasierter
Fragestellungen auszuwerten.
Die Konferenz geht mit einem CLARIN-D-Workshop zum Arbeitspaket 5 „Sprachressourcen und Dienste“
einher. Dieser Workshop knüpft an den CLARIN-D/AP5-Workshop vom Januar 2013 an und widmet sich
den neuen Entwicklungen im Verbundprojekt CLARIN-D rund um den Aufbau, das Angebot und Möglichkeiten
der Auswertung von CLARIN-kompatiblen Sprachressourcen. Dabei werden die in CLARIN verfügbaren
Ressourcen, Tools und Services behandelt und die Maßnahmen zur Sicherstellung der homogenen
Aufbereitung von Ressourcen (Richtlinien und Schulungseinrichtungen) vorgestellt.
2 Anmeldung
Eine Teilnahmegebühr fällt nicht an. Eine Anmeldung zur Teilnahme an der Konferenz
und/oder am Workshop wird bis zum 10. November 2014 erbeten.
3 Veranstalter
4 Veranstaltungsort
Berlin-Brandenburgische Akademie der Wissenschaften
Jägerstr. 22/23, Berlin
– Einsteinsaal –
Hinweise zur Anfahrt
5 Veranstaltungszeiten
Mo, 17. Nov. |
9:00–12:30 Uhr |
Workshop CLARIN-D, Arbeitspaket 5: Sprachressourcen und Dienste |
Mo, 17. Nov. |
13:30–20:00 Uhr |
Konferenz (Tag 1) |
Mo, 17. Nov. |
ab ca. 20:00 Uhr |
Gemeinsames Abendessen (auf eigene Rechnung) |
Di, 18. Nov. |
9:00–15:30 Uhr |
Konferenz (Tag 2) |
6 Programm
Montag, 17. November 2014 |
CLARIN-D Workshop |
9:00–9:30 |
Axel Herold (Berlin) |
CLARIN-D-Ressourcen: Was kann ich nutzen, und wie funktioniert das?
[Folien]
|
9:30–10:00 |
Susanne Haaf (Berlin), Bryan Jurish (Berlin) |
Die Vielfalt vereinen: Die CLARIN-Eingangsformate CMDI und TCF
[Folien]
|
10:00–10:30 |
Volker Boehlke (Leipzig) |
„CLARINifizierung“ von Ressourcen – Anforderungen, Beispiele und Erfahrungen
[Folien]
|
10:30–11:00 |
Pause |
11:00–11:30 |
Thorsten Trippel (Tübingen) |
Stets zu Diensten: Wenn Textdaten auf Services treffen |
11:30–12:00 |
Kai Zimmer (Berlin) |
Repositories in CLARIN-D am Beispiel des CLARIN-D-Servicezentrums an der BBAW
[Folien]
|
12:00–12:30 |
Timm Lehmberg (Hamburg) |
Helpdesk für Ressourcen – Ressourcen für den Helpdesk
[Folien]
|
12:30–13:30 |
Mittagspause |
DTA- & CLARIN-D-Konferenz, Tag 1 |
13:30–13:45 |
Alexander Geyken (Berlin) |
Begrüßung |
Themenblock 1: Ressourcengestützte Forschungsfragen, Teil 1 |
13:45–14:15 |
Gregory Crane (Leipzig) |
Getting to Open Greek and Latin |
14:15–14:45 |
Fotis Jannidis (Würzburg) |
Eine korpusgestützte Geschichte des deutschsprachigen Romans von 1500 bis 1950 |
14:45–15:15 |
Jochen Tiepmar (Leipzig) |
Canonical Text Service und Text Re-Use am Beispiel des DTA-Korpus
[Folien]
|
15:15–15:45 |
Pause |
15:45–16:15 |
Robert Strötgen (Braunschweig) |
Das Korpus digitalisierter historischer Schulbücher von GEI-Digital als Ausgangspunkt
geisteswissenschaftlicher Forschungsfragen
[Folien]
|
16:15–16:45 |
Sascha Schroeder (Berlin) |
Textkorpora in der pädagogisch-psychologischen Forschung: Anwendungen und Perspektiven
[Folien] |
16:45–17:15 |
Achim Saupe (Potsdam) |
Ordnung, Sicherheit und Risiko seit den 1960er Jahren. Perspektiven einer historischen
Semantik der Geschichte der Gegenwart |
17:15–17:45 |
Pause |
17:45–18:45 |
Norbert Dittmar (Berlin) |
Abendvortrag: Der Fall der Mauer im Spiegel des Berliner Wendekorpus: Soziolinguistische
Bedeutung und didaktische Anwendbarkeit [Bibliographie] |
18:45–20:00 |
Empfang |
Dienstag, 18. November 2014 |
DTA- & CLARIN-D-Konferenz, Tag 2 |
Themenblock 1: Ressourcengestützte Forschungsfragen, Teil 2 |
9:00–9:30 |
Britt-Marie Schuster (Paderborn) |
Historische Zeitungskorpora als Materialien einer Geschichte des öffentlichen
Kommunizierens: „Die Stats- und gelehrte Zeitung des Hamburgischen unpartheyischen
Correspondenten“ als Beispiel
[Folien] |
9:30–10:00 |
Christopher Kolbeck (Regensburg), Kathrin Pindl (Regensburg), Susanne Haaf (Berlin) |
Regensburger Rechnungsbücher interdisziplinär: Wirtschafts- und sprachhistorische Perspektiven
[Folien]
|
Themenblock 2: Aufbereitung, Zusammenführung und Auswertung von Ressourcen |
10:00–10:30 |
Elke Teich (Saarbrücken), Christoph Draxler (München), Hannah Kermes (Saarbrücken) |
Kontextualisierung von Sprachressourcen und -technologie in der geisteswissenschaftlichen Forschung
[Folien]
|
10:30–11:00 |
Pause |
11:00–11:30 |
Peter Fankhauser (Mannheim) |
Generative bayes'sche Modelle zur explorativen Analyse eines historischen Zeitungskorpus
[Folien]
|
11:30–12:00 |
Kay-Michael Würzner (Berlin) |
Die Integration von OCR-erfassten Texten in das Deutsche Textarchiv am Beispiel der
Zeitschrift „Die Grenzboten“ (1841–1922)
[Folien] |
12:00–12:30 |
Michael Beißwenger (Dortmund), Lothar Lemnitzer (Berlin) |
Deutsches Referenzkorpus zur internetbasierten Kommunikation – Fragen der Standardisierung und Datenerhebung
[Folien]
|
12:30–13:30 |
Pause |
13:30–14:00 |
Jonas Kuhn (Stuttgart), André Blessing (Stuttgart) |
Computerlinguistische Techniken und Textanalyse jenseits der grammatischen Struktur
[entfällt] |
14:00–14:30 |
Bryan Jurish (Berlin) |
Semantics, Similarity and Corpus Search in the Deutsches Textarchiv
[Folien]
|
14:30–15:00 |
Stefan Dumont (Berlin) |
correspSearch – Briefeditionen vernetzen
[Folien]
|
15:00–15:30 |
Dieter van Uytvanck (Nijmegen) |
Auf der Suche nach Sprachressourcen: CLARINs Virtual Language Observatory
[Folien] |
Programm als PDF
8 Kontakt
Deutsches Textarchiv
Berlin-Brandenburgische Akademie der Wissenschaften
Jägerstr. 22/23
10117 Berlin
E-Mail: dta@bbaw.de
Tel.: +49 (0)30 20370 523
|