Wir alle haben schon einmal versucht, alte Bekannte durch Googeln wiederzufinden. Manchmal ist das einfach, manchmal ausgesprochen schwierig. Der Jürgen aus der Oberstufe, hieß der jetzt Müller oder Möller? Wollte er Betriebswirt oder Arzt werden? Ob der wohl in Köln geblieben ist? Welcher von den vielen Jürgens in der Trefferliste ist es denn nun?
Museen stehen vor einer ähnlichen Herausforderung. In ihren Datenbanken sind Namen von Künstler:innen oder Sammler:innen notiert. Und leicht kann es passieren, dass bei der Erfassung „George Grosz“ als „Georg Gross“ in einem Formularfeld eingetragen wird. Sucht man später für eine Sonderausstellung über George Grosz alle seine Werke in der Datenbank, übersieht man wahrscheinlich die Zeichnung vom falschen „Georg“.
Namen sind mehr als Schall und Rauch
Eine Lösung für dieses Problem stellen normierte Vokabulare dar. Das umfangreichste Vokabular hierzulande ist die Personenliste in der Gemeinsamen Normdatei (GND), die von der Deutschen Nationalbibliothek betreut wird. Diese Liste enthält Personen, die irgendwann einen gedruckten Text verfasst haben oder in ihm erwähnt werden. Jeder Eintrag – derzeit über 5,6 Millionen – hat eine Identifikationsnummer (IDN). Der Verfasser dieses Beitrags beispielsweise ist in der GND hier zu finden: https://d-nb.info/gnd/1031972226 und wird über seine IDN in Bibliothekskatalogen mit seinen Werken verknüpft (etwa: https://av.tib.eu/media/55731).
In Museen ist die Lage häufig anders als in Bibliotheken. Nicht alle Häuser haben eigene Normvokabulare oder greifen auf Verzeichnisse wie die GND zu. Die Idee hinter dem Projekt GND4C – zu lesen als GND for culture – ist es deshalb, Werkzeuge, Workflows und Anleitungen zu entwickeln, um Daten aus Museen mit den GND-Normdaten zu vernetzen. Das soll vorerst für vier besonders häufige Datentypen geschehen: Personen, Ortsangaben, Bauwerke und Sachbegriffe. So wird es den Museen möglich, ihre Daten nach den normierten Einträgen der GND zu vereinheitlichen, fehlende Informationen zu ergänzen und dadurch ihre Datenqualität zu verbessern. Umgekehrt gibt es zweifellos an den Museen zahllose wertvolle Datensätze und Detailinformationen, die in der GND fehlen und dort hinzugefügt werden sollten.
Gemeinsam zum richtigen Georg
Doch wie findet man in der GND den korrekten „George Grosz“, wenn in der Museums-Datenbank fälschlich „Georg Gross“ eingetragen wurde? Liegt vielleicht ein Geburtsjahr oder Beruf vor und kann für die Suche herangezogen werden? Wie groß darf eine Abweichung im Namen sein, um in der Suche noch berücksichtigt zu werden? In welchen kryptisch bezeichneten Feldern der Museumsdatenbanken liegen interessante Informationen und kommt man da über Schnittstellen ran?
Die komplexen, manchmal sehr technischen Fragestellungen können nur in einem großen Verbundprojekt bearbeitet werden. Finanziert von der Deutschen Forschungsgemeinschaft arbeiten wir dafür mit dem Bibliotheksservice-Zentrum Baden-Württemberg, dem Deutschen Dokumentationszentrum für Kunstgeschichte in Marburg, der Deutschen Nationalbibliothek, der digiCULT-Verbund eG in Kiel sowie dem Landesarchiv Baden-Württemberg zusammen. Jede Partnerinstitution hat ihre speziellen Aufgaben. An der ThULB entsteht in Zusammenarbeit mit der digiCULT-Verbund eG eine Software, die den Abgleichprozess mit der GND soweit möglich automatisieren soll. Zum Projektende im Sommer 2024 soll diese es Museen in ganz Deutschland erlauben, ihre Daten und die GND leichter zusammenzubringen.
Autor: Michael Markert
Projektpartner | Bibliotheksservice-Zentrum Baden-Württemberg (BSZ), Deutsche Nationalbibliothek (DNB), Deutsches Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg (DDK), digiCULT-Verbund e.G., Landesarchiv Baden-Württemberg (LABW) |
Förderzeitraum | 2018 bis 2024 (ab 2022 mit Beteiligung der ThULB) |
Fördergeber | Deutsche Forschungsgemeinschaft (DFG) |
Fördersumme | 567.400 € (Anteil der ThULB) |