Skip to content

Migrationspfade für Dateiformate

Sollen digitale Objekte langfristig aufbewahrt, nutzbar gehalten und bei Bedarf in andere Formate konvertiert werden können, so müssen sie in ein standardisiertes Archivformat überführt werden. Eine überschaubare Anzahl von Dateiformaten im digitalen Archiv ermöglicht es, diese aktiv zu überwachen und bei Bedarf Erhaltungsmassnahmen durchzuführen.

Die nachfolgende Übersicht zeigt auf, welche Formate wir für die Archivierung empfehlen und wo eine automatische Migration beim Ingest möglich ist. Dabei ist zu beachten, dass es sich um Empfehlungen handelt und nicht um Vorschriften von absoluter Gültigkeit. Der Entscheid für eine Konvertierung und die Wahl des geeigneten Zielformats ist immer auch von den Eigenschaften einer Datei und ihrem künftigen Verwendungszweck abhängig: Sollen die Dateien ihre Funktionalität behalten und später noch weiter bearbeitet werden können, oder soll das aktuelle optische Erscheinungsbild „eingefroren“ werden? Auch die Frage, ob die Originale zusammen mit den migrierten Dateien aufbewahrt werden, beeinflusst das gewählte Verfahren.

Die Empfehlungen spiegeln unsere aktuellen Überlegungen und werden in regelmässigen Abständen revidiert. Generell verweisen wir auf das Merkblatt Archivtaugliche Dateiformate des Schweizerischen Bundesarchivs und den Katalog archivischer Dateiformate der KOST. Für audiovisuelle Medien sind zudem die Empfehlungen von Memoriav hilfreich.

Art der Daten empfohlenes Archivformat vorläufig akzeptiert Migration beim Ingest? Kommentar
Textverarbeitung (Office-Formate, RTF) PDF/A-2 (bevorzugt),
PDF/A-1
DOCX, ODT, PPTX, ODP ja, nach PDF/A Besondere Inhalte wie Makros oder Animationen gehen bei der Migration verloren.
Text (unstrukturiert) TXT (Plain Text) nein keine Migration notwendig
Tabellen (strukturierter Text) CSV nein keine Migration notwendig
Tabellenkalkulation PDF/A-2 (bevorzugt),
PDF/A-1
XLSX, ODS ja, nach PDF/A

Eine Konvertierung in PDF/A empfiehlt sich nur, wenn der Layout-Aspekt im Vordergrund steht.

Funktionen und Formeln gehen bei der Migration verloren.

PDF PDF/A-2 (bevorzugt),
PDF/A-1
ja, nach PDF/A Digitale Signaturen gehen bei der Migration verloren.
Rasterbilder TIFF, JPEG2000 JPEG möglich, aber nicht zwingend

Aufgrund der starken Verbreitung von JPEG ist eine Konvertierung aktuell nicht notwendig.

Für RAW-Dateien empfiehlt sich eine Konvertierung in DNG vor dem Ingest.

Vektorgrafiken SVG EPS nein Konvertierung von EPS in PDF/A beim Ingest ist möglich (gegenwärtig allerdings nicht in der Cloud).
Audio WAVE MP3, AIFF, FLAC, ALAC möglich, aber nicht zwingend

Eine Migration ist für bestehende MP3-, AIFF-, FLAC- oder ALAC-Dateien vorerst nicht notwendig.

Metadaten gehen bei der Konvertierung in WAVE verloren.

Video FFV1 (.mkv) MPEG-4 möglich, aber nicht empfohlen Bei speicherintensiven Formaten wie AVI oder MOV kann eine Migration nach FFV1/MKV sinnvoll sein. Für Digitalisate ab DVD reicht eine Konvertierung in MPEG-4. Eine Migration sollte in jedem Fall vor dem Ingest erfolgen.
Markup XML HTML möglich, aber nicht empfohlen Konvertierung von HTML in PDF/A beim Ingest ist möglich, aber interaktive oder Multimedia-Inhalte gehen dabei verloren.
E-Mail EML oder PDF/A MSG möglich, nach PDF/A Der Umgang mit Attachments hängt von deren Formaten ab und ist im konkreten Anwendungsfall zu prüfen.
Webseiten WARC nein

WARC ist ein Container-Format, das die digitalen Ressourcen einer Webseite zusammenfasst, aber keine Formatkonvertierung macht.

Für einzelne Seiten kann auch eine Konvertierung in PDF/A sinnvoll sein (siehe HTML).

Für die Bewahrung von interaktiven Webseiten empfiehlt sich das Erstellen von Screencasts.

Datenbanken (relational) SIARD nein Eine allfällige Migration sollte vor dem Ingest erfolgen.
Geodaten (GIS) INTERLIS 1 (Vektordaten),
TIFF mit EWF (Rasterdaten)
GeoPackage nein

Eine allfällige Migration sollte vor dem Ingest erfolgen.

Karten und Pläne können aus GIS-Programmen als PDF exportiert und beim Ingest in PDF/A konvertiert werden.

CAD/CAM DWG, IFC nein

Eine allfällige Migration sollte vor dem Ingest erfolgen.

Karten oder Pläne können aus CAD-Programmen als PDF exportiert und beim Ingest in PDF/A konvertiert werden.

Ungeeignete Dateiformate

Auf eine Aufzählung von Formaten, die sich nicht für eine langfristige Archivierung eignen, wird an dieser Stelle verzichtet, da sie niemals abschliessend sein kann. Einige Hinweise ergeben sich implizit aus der obigen Liste: So sind etwa die binären Microsoft Office-Formate vor Office 2007 (.doc, .ppt, .xls) als nicht archivwürdig einzustufen. Demgegenüber können die neueren, XML-basierten Office-Formate im digitalen Archiv akzeptiert werden, da sie auch ohne Office-Applikationen lesbar sind.

Grundsätzlich ungeeignet sind proprietäre Formate, die sich nur mit spezieller Software nutzen lassen, eine geringe Verbreitung haben und nicht offen spezifiziert sind. Daten aus spezialisierten Fachapplikationen sollten, sofern die Software es erlaubt, in ein archivtaugliches oder beim Ingest migrierbares Format wie PDF exportiert werden. Oft ist jedoch die Konvertierung in ein Archivformat mit Funktionalitätsverlusten verbunden. 

Ungeeignet für die Archivierung sind auch Zip-Dateien, da beim Ingest mit docuteam feeder keine Analyse und Migration der darin enthaltenen Dateiformate möglich ist. Das Zip-Format ist nur für ganze SIPs zulässig, die beim Ingest entpackt werden.

Standardkonfiguration für Formatmigrationen im docuteam feeder

Die Konfiguration für Formatmigrationen, die beim Ingest mit docuteam feeder automatisch erfolgen, ist im migration-config.xml definiert. Die Migrationsregeln basieren auf verschiedenen Kriterien der Formatidentifikation, die in einer bestimmten Reihenfolge abgearbeitet werden:

  • Formatmigration anhand PRONOM-PUID (1. Priorität)
  • Formatmigration anhand MIMEType (2. Priorität)
  • Formatmigration anhand Dateiendung (3. Priorität)

Detaillierte Informationen zur Konfiguration der Migrationsregeln finden Sie in unserer Dokumentation.

Eine tabellarische Darstellung der aktuellen Standardkonfiguration für Formatmigrationen anhand PRONOM-PUID, MIMEType und Dateiendung folgt zu einem späteren Zeitpunkt.

An den Anfang scrollen