Minimalanforderungen an ein digitales Archiv
In Projekten hören wir oft die Aussage: „wir benötigen kein digitales Langzeitarchiv, wir wandeln alles nach PDF/A um und haben damit das Archivproblem gelöst“. Wobei statt PDF/A beliebig auch Tiff, JPEG2000 oder ein anderes Format genannt wird von dem man hofft, dass es noch längere Zeit lesbar ist.
Lässt sich die Herausforderung digitale Archivierung durch simple Umwandlung von Dateien in bestimmte Zielformate lösen? Wir wären alle froh, wenn es so einfach wäre. Ist es aber nicht.
Welches sind aus Sicht von docuteam die wichtigsten Anforderungen an eine Archivumgebung?
- Identifizierbarkeit: Jede Ressource, also auch jede Datei in einem digitalen Archiv muss eindeutig identifiziert werden. Dazu gibt es Verfahren wie DOI oder ARK.
- Integrität: Es braucht Verfahren, um die Integrität, also die Unverändertheit von Daten nachweisen zu können. Dazu werden Checksummen oder digitale Signaturen verwendet. Gegenwärtig wird diskutiert, wie Blockchain-Technologie zu diesem Zweck verwendet werden kann, siehe beispielsweise diesen Fachartikel.
- Kontextualisierung: Die Herkunft, Entstehung und Bedeutung der Daten muss dokumentiert sein, sprich es braucht Informationen über den Kontext. Nur so können die Daten historischen Ereignissen zugeordnet und ihre Bedeutung auch aus einem grossen zeitlichen Abstand eingeordnet werden. Das Matterhorn RDF Datenmodell, entwickelt vom Staatsarchiv Wallis und docuteam, legt die Grundlagen für eine verbesserte Kontextualisierung.
Wenn Daten dann zusätzlich noch in Formaten gespeichert werden, welche offen dokumentiert, weit verbreitet und nicht mit Patenten/Lizenzen versehen sind, dann erhöht das die Chance, dass sie auch nach langer Zeit noch genutzt werden können. Aber die Bedeutung archivtauglicher Dateiformate liegt nicht an erster Stelle. Wir sehen sie erst auf Platz vier — also nicht einmal in den Medaillenrängen!