docuteam Community Day 2018: Neue Schnittstellen ins Langzeitarchiv
Am 31.10.2018 veranstaltete docuteam in Olten seinen zweiten Community Day. Ein ganzer Tag stand der Austausch zwischen docuteam und interessierten ArchivarInnen im Zentrum. Das Angebot stiess auf grosses Interesse. Rund 50 Gäste aus der ganzen Schweiz kamen an die Fachhochschule Nordwestschweiz, in deren Räumlichkeiten der Anlass stattfand.
Bereits in der Einführung wurde betont, dass man keineswegs eine Konferenz im klassischen Sinne organisieren, sondern gezielt die Gelegenheit des intensiven Wissens- und Erfahrungsaustauschs mit der Community bieten wollte. Nach einem Inputreferat von Michael Rauch (Zazuko) über die Idee und Umsetzung von Linked Data mittels RDF (Ressource Description Framework) ging es dann auch zugleich zu den Workshops, die den Rest des Tages füllten.
Einer der Workshops, geleitet von Thomas Bernhart, drehte sich um Schnittstellen zu docuteams modular aufgebauter Langzeitarchivlösung cosmos. Eine Herausforderung der digitalen Langzeitarchivierung ist es, Daten und Metadaten von proprietären Strukturen zu lösen und in ein Format zu bringen, das die Lesbarkeit auch in Jahren noch garantieren kann. Dazu bedarf es Metadaten nicht nur zum Inhalt der Datei, um sie später gezielt suchen zu können, sondern auch technische und strukturelle Metadaten, eine Versionierung und die Möglichkeit, die Schritte, die ein Objekt vom Zeitpunkt des Eintritts in ein Langzeitarchiv durchlaufen hat, nachzuvollziehen. docuteam verwendet dafür den Metadatenstandard Matterhorn METS. Dieser basiert auf dem international weit verbreiteten Standards METS, erweitert durch PREMIS- und EAD-Metadaten. Matterhorn METS ist von der Library of Congress anerkannt und wurde von docuteam selbst, in Zusammenarbeit mit dem Staatsarchiv Wallis, entwickelt.
Beim Ingest digitaler Objekte aus Produktivsystemen in ein Langzeitarchiv müssen verschiedene Schritte für die Qualitätssicherung durchlaufen werden. Dazu gehört neben der Anreicherung von Metadaten auch die Erstellung einer Prüfsumme für die spätere Integritätsprüfung, Virenchecks und Dateikonvertierungen.
Die spezifischen Themen, die in diesem Rahmen diskutiert worden sind, wurden von den TeilnehmerInnen vorgegeben. Eine Frage drehte sich beispielsweise um die Dateimigration, die im System, das docuteam anbietet (docuteam feeder), automatisch anhand der Konfiguration mit verschiedenen Applikationen (darunter ffmpeg, imageMagick oder PDFTools) durchgeführt wird. Dabei wird bei der Bestimmung sowohl des Ausgangs- als auch des Zielformats nicht nur auf die Dateiendung geachtet, sondern auch Informationen aus dem Header der Datei ausgelesen.
Verschiedene Systeme miteinander zu verbinden bedeutet, saubere (im Idealfall standardisierte) Schnittstellen, wie beispielsweise OAI-PMH, zur Verfügung zu stellen. Dies sei jedoch nicht immer auf diesem hohen Niveau nötig. Insbesondere müsse zunächst überhaupt entschieden werden, welche Objekte archivwürdig seien und ob es nicht einen einfachen Weg gebe, diese aus einem System zu exportieren. Denn Schnittstellen zu entwickeln kostet viel Geld und eines der Anliegen von docuteam ist es auch, Unterstützung bei der Suche nach kosteneffizienten Lösungen zu bieten, die manchmal einfacher sind, als man denkt.
Der Community Day enthielt, um den Austausch zu fördern, auch lange Pausen und ein gemeinsames stand-up Mittagessen, die für angeregte Gespräche und vertiefte Diskussionen genutzt wurden. Insgesamt lässt sich sagen, dass das Ziel des Austauschs zweifelsfrei erreicht worden ist. Schade nur, dass solche Veranstaltungen nicht öfter stattfinden.