Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

DTA-Nachrichten vom 10. März 2017

Ausschreibung für Modulprojekte im Rahmen von OCR-D

OCR-DAm 6. März 2017 wurde eine vom DFG-Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren (kurz OCR-D), dem das Zentrum Sprache an der BBAW angehört, federführend konzipierte Ausschreibung veröffentlicht

Das im Herbst 2015 gestartete Koordinierungsprojekt OCR-D hat zum Ziel, Verfahren zu beschreiben und Richtlinien zu erarbeiten, um einen optimalen Workflow sowie eine möglichst weitreichende Standardisierung von OCR-bezogenen Prozessen und Metadaten zu erzielen. Des Weiteren soll die vollständige Transformation des schriftlichen deutschen Kulturerbes in eine maschinenlesbare Form (strukturierter Volltext) konzeptionell vorbereitet werden. Vornehmlich betrachtet werden Werke aus den Verzeichnissen der im deutschen Sprachraum erschienenen Drucke des 16. bis 18. Jahrhunderts (VD).

Am Koordinierungsprojekt sind neben der BBAW die Herzog August Bibliothek Wolfenbüttel und die Staatsbibliothek zu Berlin beteiligt. In der ersten Projektphase wurden Entwicklungsbedarfe für Verfahren der automatischen Texterkennung ermittelt. Darauf aufbauend erfolgt nun die Ausschreibung zu sechs Themenkomplexen:

  • Bildvorverarbeitung
  • Layouterkennung
  • Textoptimierung
  • Modelltraining
  • Langzeitarchivierung und Persistenz
  • Qualitätssicherung

Um einen Eindruck des zu behandelnden Materials zu gewinnen, stellen wir unter www.ocr-d.de/daten Referenzmaterialien zur Verfügung.

Interessierte werden gebeten, bis zum 26. April 2017 eine Absichtserklärung bei der Deutschen Forschungsgemeinschaft einzureichen. Die Frist zur Einreichung der Förderanträge endet am 31. Mai 2017.

von Frank Wiegand, 10. März 2017