Lerneinheit 10: Linked Data
Der nachfolgende Blogpost bezieht sich auf die Unterrichtseinheit vom 03.06.2024 am Nachmittag. In diesen vier Lektionen ging um Linked Data (siehe auch gemeinsames Dokument dieser Lerneinheit). Als Erstes haben wir aktuelle Datenmodelle für Metadaten angeschaut. Danach haben wir uns mit Linked Open Usable Data (LOUD) und anschliessend noch mit der Anreicherung von Metadaten mit OpenRefine und Wikidata beschäftigt.
Aktuelle Datenmodelle für Metadaten
Aktuelle Datenmodelle für Metadaten sind BIBFRAME im Bibliothekswesen und Records in Context (RiC) im Archivwesen. Diese beiden Datenmodelle wurden bereits in früheren Lerneinheiten kurz thematisiert (siehe Lerneinheit 3 und Lerneinheit 4). Da die beiden Datenmodelle in den Blogposts nur eher kurz erwähnt sind, hier noch einmal eine grobe Zusammefassung:
BIBFRAME ist der Nachfolger von MARC21 und folgt den Linked Data Prinzipien. BIBFRAME besteht aus dem Model (siehe Bild), welches zwischen Work, Instance und Item unterscheidet und die Entitäten Agent, Subject und Event definiert, sowie aus dem Vocabulary, welches Konzepte und deren Eigenschaften zur Beschreibung der Entitäten definiert.
(Bildquelle: loc.gov)
RiC basiert ebenfalls auf den Linked Data Prinzipien und ermöglicht neue und mehrfache Beziehungen zwischen Entitäten. Die Grundlage für die praktische Umsetzung von RiC in der Schweiz ist jedoch noch in Arbeit. Die Ontologie des Datenmodells wird von ICA/EGAD ausführlich erklärt: RiC Ontologie.
(Bildquelle: ica.org)
Linked Open Usable Data
Es reicht nicht, wenn die Daten linked und open sind, sie müssen auch usable sein, denn nur so bringen sie einen Mehrwert. Aus Linked Open Data (LOD) entstand aus diesem Grund das erweiterte Konzept Linked Open Usable Data (LOUD). LOUD ist jedoch noch nicht gleich weit verbreitet/bekannt wie LOD, wie man auch bei der Abfrage verschiedener LLMs erkennen konnte (siehe Übung im gemeinsamen Dokument).
⚠️ Eine ausführlichere Beschreibung von LOUD kann beispielsweise unter linked.art oder Linked Open Data - Eine Einführung von Adrian Pohl gefunden werden.
Metadatenanreicherung
Zum Abschluss der Lerneinheit haben wir noch angeschaut, wie man Metadaten mit OpenRefine und WikiData anreichern kann. In Gruppen haben wir dies auch gleich noch praktisch durchgeführt (die genauen Schritte und Erkenntnisse können im gemeinsamen Dokument nachgelesen werden). Um die Metadaten anzureichern haben wir das Verfahren der ‘Reconciliation’ angewendet. Eine Voraussetzung für dieses Verfahren sind einheitliche und korrekte Daten. In der Theorie funktioniert das sehr gut, in der Praxis kann es jedoch immer wieder zu Problemen kommen, wie beispielsweise zu Falschzuordnungen aufgrund falscher Erfassung von Identifiern.
💡 Reconciliation = “Reconciliation is the process of integrating data from sources which do not share common unique identifiers by identifying records which refer to the same entities. This happens mostly by comparing the attributes of the entities. For instance, two entries in a catalogue about persons that share the same date of birth, place of birth, name and death date, will probably be about the same person. Linking these two entries by adding the identifier from another data source is the process of reconciliation. This allows for extension of your data by taking over information from a linked record.” 1