Das Crowdsourcing-Modul der "Digitalen Landesbibliothek Oberösterreich" (DLOÖ
- Das Crowdsourcing-Modul der „Digitalen Landesbibliothek
Oberösterreich“ (DLOÖ).
Die „Digitale Landesbibliothek Oberösterreich“ (http://digi.landesbibliothek.at) ist seit März 2010
online. Viele verschiedene Entwicklungen wurden seither vorangetrieben. Zu eine der wichtigsten
zählt die Entwicklung eines Crowdsourcing-Moduls.
Im Juni 2013 hörte ich auf einer Tagung zu unserer Viewer-Software zum ersten Mal von einem
Crowdsourcing-Tool das die Zentral- und Landesbibliothek Berlin gemeinsam mit ihrer technischen
Betreuungsfirma entwickelte und dazu benutzte den OCR-Text von Adressbüchern zu verbessern.
Naturgemäß sind verschachtelte Tabellen wie sie in Adressbüchern Verwendung finden neben
unzureichender Druckqualitäten und Frakturschriften als Hauptursache für schlechte OCRErgebnisse
anzusehen. An der Landesbibliothek Berlin versuchte man die Erkennungsqualität
durch den Einsatz eines Crowdsourcing-Moduls zu verbessern. Im Vorfeld gab es Bedenken
wegen möglicher Probleme mit elektronischem Vandalismus. Eine Mitarbeiterin der
Landesbibliothek Berlin berichtete davon, dass sich derartige Bedenken nicht bewahrheitet hätten.
Ganz im Gegenteil, durch den breiten Einsatz vieler „freiwilliger“ Mitarbeiterinnen und Mitarbeiter
wurde die Qualität des OCR-Textes erheblich verbessert.
Gerade im Bereich der Volltexte kann die Verbesserung von Volltexten kaum mehr von den
Einrichtungen im Detail geleistet werden und so hat sich auch die OÖ Landesbibliothek dazu
entschlossen ein derartiges Tool zu entwickeln.
Seit Jänner 2014 arbeitete die OÖ Landesbibliothek an eben diesem Crowdsourcing-Modul
gemeinsam mit der Betreuungsfirma.
Rasch zeigte sich, dass es viele weitere und spezifische Anforderungen von unserer Seite her gab,
die bisher noch gar nicht entwickelt waren. Diese standen auch unmittelbar im Kontext mit der bei
uns vorhandenen Materialheterogenität. Neben Monographien können bei uns auch Zeitschriften,
alte Drucke und Handschriften im Crowdsourcing-Modul bearbeitet und angereichert werden.
In dem nun folgenden Prozess wurden über Monate hinweg vorhandene Funktionen angepasst
und neue Features entwickelt.
Im Nachhinein darf diese lange Phase der Entwicklung als Glücksfall für die DLOÖ bezeichnet
werden, da erst durch diese tiefgehenden Tests und laufende Anpassungen, Innovation, Usabilty
und Stabilität ermöglicht wurden.
Um Besucher zu animieren an unserer Plattform teilzunehmen, wurden insbesondere vorhandene
Zugangsbeschränkungen so weit als möglich ausgeräumt.
Zur Mitarbeit genügt schon ein Open-ID-Account, wie er in vielen sozialen Netzwerken zum
Einsatz kommt, gleichwohl man sich aber auch ganz herkömmlich registrieren kann.
Neben unserem Hauptziel bessere Volltexte zu erhalten, besteht auch die Möglichkeit Metadaten
zu Personen, Einrichtungen, Adressen und Kommentaren mit unterschiedlichen Eingabefeldern zu
erfassen. Mit Jänner 2015 wurde der Probebetrieb aufgenommen und seit März dieses Jahres wird
unser Modul zur Datenanreicherung im Vollbetrieb geführt.