Lerneinheit 7: Metadaten modellieren und Schnittstellen nutzen 2/2
Der nachfolgende Blogpost bezieht sich auf die Unterrichtseinheit vom 07.05.2024. In diesen zwei Lektionen ging es um die Nutzung von Schnittstellen (siehe auch gemeinsames Dokument dieser Lerneinheit). Nachdem wir uns in Lerneinheit 6 mit der Modellierung von Metadaten am Beispiel von OpenRefine beschäftigt haben, widmet sich diese Lerneinheit nun der Nutzung von Schnittstellen sowie der Konvertierung zwischen Metadatenstandards. In dieser zentralen Lerneinheit fliessen folglich viele der zuvor gelernten Themen zusammen, wie auch im Schaubild des Moduls ersichtlich wird:
Schnittstellen
Schnittstellen dienen dem Austausch von Daten zwischen verschiedenen Systemen. Der Austausch findet mit Hilfe von Austauschprotokollen statt. Im Bibliotheks- und Archivbereich gibt es viele solcher Protokolle. Wir haben uns OAI-PMH näher angeschaut. Dazu haben wir in Codespace mit einem vorbereiteten Repository Daten mit VuFindHarvest (Software) aus den in vorherigen Lerneinheiten angeschauten Systemen (Koha, ArchivesSpace und DSpace) über deren angebotene Schnittstellen abgerufen. Die Daten aus Koha wurden im Format MARC21, die Daten aus ArchivesSpace in EAD und die Daten aus DSpace in OAI-DC abgerufen. Die auf den Systemen verfügbaren Metadatenformate können in den Systemen nachgeschaut werden (für URL siehe gemeinsames Dokument)
💡 Metadata Harvesting = automatisierte Sammlung von Metadatenbeschreibungen aus verschiedenen Quellen, um nützliche Aggregationen von Metadaten und zugehörigen Diensten zu erstellen 1
💡 VuFindHarvest = OAI Harvester von VuFind (= Discovery-System)
💡 Je nach System sind die Daten bereits im gewünschten Format vorhanden (in unserem Fall MARC21) und können direkt in diesem Format anstatt im Ausgansformat heruntergeladen werden. Teilweise sind diese Angebote aber auch nicht vorhanden oder relativ schlecht. In diesen Fällen ist es sinnvoller, die Daten im Ausgangsformat abzufragen und dann noch selbst zu konvertieren.
Konvertierung
Nach dem Sammeln der Daten aus den unterschiedlichen Systemen, haben wir die Konvertierung der Daten angeschaut. Die Konvertierung von einem Metadatenstandard in einen anderen wird auch als ‘Crosswalk’ bezeichnet. Ein solcher Crosswalk beinhaltet Regeln, wie das Mapping (Zuordnung von Elementen und Werten) gemacht werden soll. Im Idealfall ist ein Crosswalk verlustfrei (d. h. Elemente und Werte können 1:1 zugeordnet werden), in der Realität ist dies jedoch meistens nicht der Fall.
Die Konvertierung wird mit XSLT, einer Programmiersprache zur Transformation von XML-Dokumenten, gemacht (mehr dazu unter Transforming Data for Reuse and Republication with XML and XSL). Diesen Code haben wir im Unterricht jedoch nicht selbst geschrieben, sondern wir haben vorgefertigte XSL-Sheets für die Konvertierung genutzt. Für die Transformation gibt es verschiedene Online-Tools, wobei sich jedoch nicht alle für kompliziertere XSL eignen. Ein Tool, welches das jedoch kann ist MarcEdit.
💭 Die Software MarcEdit ist zwar kostenlos nutzbar aber nicht Open Source und der Gesundheitsstatus der Software lässt zu wünschen übrig, da sie nur von einer einzelnen Person entwickelt und unterhalten wird.