In der Schweiz kündigen sie sich oft durch ein vorangestelltes “e-” an. E-Periodica, E-Pics, e-rara, e-manuscripta sind nur einige, der mit einem “e-” anfangenden Plattformen mit retrodigitalisierten Beständen in der Schweiz. Seit vielen Jahren leisten diese Seiten einen wichtigen Beitrag dazu, historische Bestände auf Bibliotheken, Archiven und Sammlungen auffindbar und nutzbar zu machen.
Das Angebot wächst dabei kontinuierlich: mehr als 130’000 Titel sind in e-rara zugänglich, das Bildarchiv auf E-Pics steht kurz davor die magische Grenze von einer Million Bilder zu überschreiten und E-Periodica umfasst mehr als 10 Millionen Seiten aus fast 1000 Zeitschriftentiteln. Die Schweiz ist dabei kein Sonderfall, auch in anderen Ländern setzen sich sogenannte GLAM-Institutionen (Galleries, Libraries, Archives and Museums) seit nun fast zwanzig Jahren für die Digitalisierung und Onlineverfügbarkeit ihrer Bestände ein, zum Beispiel in Frankreich, den Niederlanden und in den USA.
Zielgruppe dieser Angebote waren zunächst Menschen, die durch die Nutzung der Portale einen in vielerlei Hinsicht vereinfachten Zugang zu den Beständen haben sollten. In den letzten Jahren hat aber eine weitere Zugangsform an Bedeutung gewonnen, nämlich der maschinelle Zugriff auf digitalisierte Bestände mit dem Ziel, datenbasierte Analysen durchzuführen. Das 2017 erstmals erschienene “Santa Barbara Statement on Collections as Data” trug nicht nur dazu bei, dass sich die Vorstellung von “Collections as Data” weiter etablieren konnte, sondern es leistete auch einen wichtigen Beitrag zur Reflexion, beispielsweise der rechtlichen und ethischen Rahmenbedingungen. Diese Überlegungen wurden im 2023 erschienenen “Vancouver Statement on Collections as Data” weiterentwickelt, das verstärkt auch die Neuerungen im Bereich der Künstlichen Intelligenz berücksichtigt. Im Zentrum des Statements stehen aber nicht nur die Daten sondern auch die Menschen, die sich für die Vermittlung dieser Daten einsetzen:
“Collections-as-data development supports responsible computational use of digitized and born digital collections. Knowledge, data, and memory stewards expand the set of opportunities for engaging with collections by conceiving of, creating, and providing access to collections as data.”
Die beiden Papiere haben eine wichtige Grundlage für weitere Auseinandersetzungen mit der maschinenenlesbaren Zugänglichkeit von Daten geschaffen. Gerade im Kontext von Machine Learning Nutzungen spielen erweiterte Formen der Dokumentation der Datensätze eine zunehmend wichtige Rolle und derzeit von der Community diskutiert und entwickelt.
Auch in der Sektion Sammlungen und Archive setzen wir uns mit diesen Fragen auseinander. Neben verschiedenen Vorträgen (zum Beispiel in London und Lausanne) beteiligen sich die Digital Scholarship Services an dem von swissuniversities im Rahmen des ORD-Programms geförderten Projekt “Exploring ORD Practices in the Context of Collections as Data”. Die Projektwebsite ist seit kurzem online und bietet weitere Informationen zu den Projektaktivitäten.
Weiterführende Literatur:
- Padilla, Thomas; Allen, Laurie; Frost, Hannah u. a.: Santa Barbara Statement on Collections as Data — Always Already Computational: Collections as Data, 20.05.2019. https://doi.org/10.5281/ZENODO.3066208.
- Padilla, Thomas; Scates Kettler, Hannah; Varner, Stewart u. a.: Vancouver Statement on Collections as Data, in, 13.09.2023. https://doi.org/10.5281/zenodo.8342171.
- Bailey, Jefferson; Chassanoff, Alexandra; Clement, Tanya u. a.: Position Statements — Always Already Computational: Collections as Data, 20.05.2019. https://doi.org/10.5281/zenodo.3066161.
- Chambers, Sally; Walsh, Melanie; Caswell, Michelle u. a.: Position Statements -> Collections as Data: State of the field and future directions, 02.05.2023. https://doi.org/10.5281/zenodo.7897735.
- Candela, Gustavo; Gabriëls, Nele; Chambers, Sally u. a.: A Checklist to Publish Collections as Data in GLAM Institutions, 2023. https://doi.org/10.48550/ARXIV.2304.02603.
- Lee, Benjamin Charles Germain: The «Collections as ML Data» Checklist for Machine Learning & Cultural Heritage, 06.07.2022. https://doi.org/10.48550/arXiv.2207.02960.
- Alkemade, Henk; Claeyssens, Steven; Colavizza, Giovanni u. a.: Datasheets for Digital Cultural Heritage Datasets, in: Journal of Open Humanities Data 9, 30.10.2023. https://doi.org/10.5334/johd.124.
Bild: Zürich, ETH Zürich, Hauptgebäude (HG), Institut für angewandte Mathematik, Z4, Simulationsprogramm, ETH-Bibliothek Zürich, Bildarchiv / Fotograf: Unbekannt / Ans_03688 / Public Domain Mark, http://doi.org/10.3932/ethz-a-000021291