Migrationspfade für Dateiformate
Sollen digitale Objekte langfristig aufbewahrt, nutzbar gehalten und bei Bedarf in andere Formate konvertiert werden können, so müssen sie in ein standardisiertes Archivformat überführt werden. Eine überschaubare Anzahl von Dateiformaten im digitalen Archiv ermöglicht es, diese aktiv zu überwachen und bei Bedarf Erhaltungsmassnahmen durchzuführen.
Die nachfolgende Übersicht zeigt auf, welche Formate wir für die Archivierung empfehlen und wo eine automatische Migration beim Ingest möglich ist. Dabei ist zu beachten, dass es sich um Empfehlungen handelt und nicht um Vorschriften von absoluter Gültigkeit. Der Entscheid für eine Konvertierung und die Wahl des geeigneten Zielformats ist immer auch von den Eigenschaften einer Datei und ihrem künftigen Verwendungszweck abhängig: Sollen die Dateien ihre Funktionalität behalten und später noch weiter bearbeitet werden können, oder soll das aktuelle optische Erscheinungsbild „eingefroren“ werden? Auch die Frage, ob die Originale zusammen mit den migrierten Dateien aufbewahrt werden, beeinflusst das gewählte Verfahren.
Die Empfehlungen spiegeln unsere aktuellen Überlegungen und werden in regelmässigen Abständen revidiert. Generell verweisen wir auf das Merkblatt Archivtaugliche Dateiformate des Schweizerischen Bundesarchivs und den Katalog archivischer Dateiformate der KOST. Für audiovisuelle Medien sind zudem die Empfehlungen von Memoriav hilfreich.
Art der Daten | empfohlenes Archivformat | vorläufig akzeptiert | Migration beim Ingest? | Kommentar |
---|---|---|---|---|
Textverarbeitung (Office-Formate, RTF) | PDF/A-2 (bevorzugt), PDF/A-1 |
DOCX, ODT, PPTX, ODP | ja, nach PDF/A | Besondere Inhalte wie Makros oder Animationen gehen bei der Migration verloren. |
Text (unstrukturiert) | TXT (Plain Text) | nein | keine Migration notwendig | |
Tabellen (strukturierter Text) | CSV | nein | keine Migration notwendig | |
Tabellenkalkulation | PDF/A-2 (bevorzugt), PDF/A-1 |
XLSX, ODS | ja, nach PDF/A |
Eine Konvertierung in PDF/A empfiehlt sich nur, wenn der Layout-Aspekt im Vordergrund steht. Funktionen und Formeln gehen bei der Migration verloren. |
PDF/A-2 (bevorzugt), PDF/A-1 |
ja, nach PDF/A | Digitale Signaturen gehen bei der Migration verloren. | ||
Rasterbilder | TIFF, JPEG2000 | JPEG | möglich, aber nicht zwingend |
Aufgrund der starken Verbreitung von JPEG ist eine Konvertierung aktuell nicht notwendig. Für RAW-Dateien empfiehlt sich eine Konvertierung in DNG vor dem Ingest. |
Vektorgrafiken | SVG | EPS | nein | Konvertierung von EPS in PDF/A beim Ingest ist möglich (gegenwärtig allerdings nicht in der Cloud). |
Audio | WAVE | MP3, AIFF, FLAC, ALAC | möglich, aber nicht zwingend |
Eine Migration ist für bestehende MP3-, AIFF-, FLAC- oder ALAC-Dateien vorerst nicht notwendig. Metadaten gehen bei der Konvertierung in WAVE verloren. |
Video | FFV1 (.mkv) | MPEG-4 | möglich, aber nicht empfohlen | Bei speicherintensiven Formaten wie AVI oder MOV kann eine Migration nach FFV1/MKV sinnvoll sein. Für Digitalisate ab DVD reicht eine Konvertierung in MPEG-4. Eine Migration sollte in jedem Fall vor dem Ingest erfolgen. |
Markup | XML | HTML | möglich, aber nicht empfohlen | Konvertierung von HTML in PDF/A beim Ingest ist möglich, aber interaktive oder Multimedia-Inhalte gehen dabei verloren. |
EML oder PDF/A | MSG | möglich, nach PDF/A | Der Umgang mit Attachments hängt von deren Formaten ab und ist im konkreten Anwendungsfall zu prüfen. | |
Webseiten | WARC | nein |
WARC ist ein Container-Format, das die digitalen Ressourcen einer Webseite zusammenfasst, aber keine Formatkonvertierung macht. Für einzelne Seiten kann auch eine Konvertierung in PDF/A sinnvoll sein (siehe HTML). Für die Bewahrung von interaktiven Webseiten empfiehlt sich das Erstellen von Screencasts. |
|
Datenbanken (relational) | SIARD | nein | Eine allfällige Migration sollte vor dem Ingest erfolgen. | |
Geodaten (GIS) | INTERLIS 1 (Vektordaten), TIFF mit EWF (Rasterdaten) |
GeoPackage | nein |
Eine allfällige Migration sollte vor dem Ingest erfolgen. Karten und Pläne können aus GIS-Programmen als PDF exportiert und beim Ingest in PDF/A konvertiert werden. |
CAD/CAM | DWG, IFC | nein |
Eine allfällige Migration sollte vor dem Ingest erfolgen. Karten oder Pläne können aus CAD-Programmen als PDF exportiert und beim Ingest in PDF/A konvertiert werden. |
Ungeeignete Dateiformate
Auf eine Aufzählung von Formaten, die sich nicht für eine langfristige Archivierung eignen, wird an dieser Stelle verzichtet, da sie niemals abschliessend sein kann. Einige Hinweise ergeben sich implizit aus der obigen Liste: So sind etwa die binären Microsoft Office-Formate vor Office 2007 (.doc, .ppt, .xls) als nicht archivwürdig einzustufen. Demgegenüber können die neueren, XML-basierten Office-Formate im digitalen Archiv akzeptiert werden, da sie auch ohne Office-Applikationen lesbar sind.
Grundsätzlich ungeeignet sind proprietäre Formate, die sich nur mit spezieller Software nutzen lassen, eine geringe Verbreitung haben und nicht offen spezifiziert sind. Daten aus spezialisierten Fachapplikationen sollten, sofern die Software es erlaubt, in ein archivtaugliches oder beim Ingest migrierbares Format wie PDF exportiert werden. Oft ist jedoch die Konvertierung in ein Archivformat mit Funktionalitätsverlusten verbunden.
Ungeeignet für die Archivierung sind auch Zip-Dateien, da beim Ingest mit docuteam feeder keine Analyse und Migration der darin enthaltenen Dateiformate möglich ist. Das Zip-Format ist nur für ganze SIPs zulässig, die beim Ingest entpackt werden.
Standardkonfiguration für Formatmigrationen im docuteam feeder
Die Konfiguration für Formatmigrationen, die beim Ingest mit docuteam feeder automatisch erfolgen, ist im migration-config.xml definiert. Die Migrationsregeln basieren auf verschiedenen Kriterien der Formatidentifikation, die in einer bestimmten Reihenfolge abgearbeitet werden:
- Formatmigration anhand PRONOM-PUID (1. Priorität)
- Formatmigration anhand MIMEType (2. Priorität)
- Formatmigration anhand Dateiendung (3. Priorität)
Detaillierte Informationen zur Konfiguration der Migrationsregeln finden Sie in unserer Dokumentation.
Eine tabellarische Darstellung der aktuellen Standardkonfiguration für Formatmigrationen anhand PRONOM-PUID, MIMEType und Dateiendung folgt zu einem späteren Zeitpunkt.