PDF/A – Das Format der Zukunft – Teil 2: PDF/A-2

Wie bereits im ersten Teil unserer Blogreihe „PDF/A – Das Format der Zukunft – Teil 1: PDF/A-1“ beschrieben, wird das PDF/A-Format (A=Archiv) bereits sehr erfolgreich für die Archivierung von Daten eingesetzt.

Die Vorteile sprechen in jedem Fall für das PDF/A als Format und so hat es sich bei Unternehmen, inzwischen auch bei Ämtern und Verwaltungen, welche Dokumente über Jahre und Jahrzehnte archivieren müssen, eingebürgert PDF/A zu nutzen. Man kann sagen: Dank ISO-Zertifizierung eignet sich das PDF/A als ideales Archivierungsformat für Behörden, Archive, Bibliotheken, Verlage usw. Mit dem Einsatz der E-Akte (Elektronische Akte) findet das Datei-Format PDF/A auch hier immer weitere Verbreitung, da es sich für eine rechtskonforme Archivierung bestens einsetzen lässt.

PDF/A zur Langzeitarchivierung nutzen

Daten längerfristig zu speichern, macht nur dann Sinn, wenn diese zu einem späteren Zeitpunkt jederzeit wieder gefunden und geöffnet werden können. Diese Anforderung an ein PDF/A Dokument zur späteren, bedingungslosen Reproduzierbarkeit beinhaltet, dass immer alle wichtigen Informationen im Dokument enthalten sind. Dazu gehören Texte, Schriftarten, Grafiken. Lesbarkeit und Erscheinungsbild müssen beim archivierten Dokument immer erhalten bleiben, damit auch die Bedingungen zur gesetzlich vorgeschriebenen Aufbewahrungsfrist sicher eingehalten werden können.

Nachdem 2005 das PDF/A zum globalen Archivierungsstandard ausgerufen wurden, haben sich nachträglich bestimmte Unterformen entwickelt. Es handelt sich hierbei um Weiterentwicklungen. Das Format PDF/A-1 (PDF/A-1a & PDF/A-1b) wurde 2011 durch die den ISO 19005-2 Standard ergänzt. Hierbei handelt es sich um das PDF/A-2 Format, das in die drei Konformitätsebenen PDF/A-2a, PDF/A-2b und PDF/A-2u unterteilt wird.

Was zeichnet das PDF/A-2 Format aus und wofür wird es verwendet?

Das Portable Document Format (PDF) lässt sich besonders gut für eine Langzeitarchivierung einsetzen, vor allem für Unternehmen, bei denen es um die Ordnung und Verwaltung großer Mengen an Dokumenten (auch E-Mails mitsamt ihrer Anhänge) geht. Das PDF/A-2 Format bietet genau wie PDF/A-1 eine eindeutige, visuelle Reproduzierbarkeit und genügt den Ansprüchen der Barrierefreiheit. Zusätzlich bietet es die Möglichkeit, JPEG 2000 und sehr großen Seitenformate zu verarbeiten. Die JPEG 2000 Bildkompression sind für gescannte Dokumente wichtig, um eine bessere Qualität erzielen zu können. JPEG2000 bietet eine verlustfreie Kompressionsstufe. Das spielt vor allem für Bibliotheken oder Archive eine Rolle, wenn diese Bücher oder historische Dokumente (z.B. Karten) scannen und archivieren möchten.

Mit PDF/A-2 kann man außerdem (im Gegensatz zu PDF/A-1) mehrere Dateien zu einem Container-PDF zusammenfügen. Das kann man auch bei einer E-Mail-Archivierung verwenden, um Anhänge separat zum E-Mail-Text abzulegen. Hinzu kommt, dass bei PDF/A-2 die Arbeit mit Transparenz noch verbessert wurde. Das ist auch dann von Bedeutung, wenn die Ursprungsdatei eine PowerPoint-Präsentation oder ein PDF mit Textmarkierungen ist. Weiteres, wichtiges Merkmal vom PDF/A-2 ist, dass Ebenen erlaubt sind, OpenType-Schriftarten eingebettet werden können und die verwendeten Digitalen Signaturen der PAdES Norm entsprechen.

Die PDF/A-Levels 2a, 2b und 2u sind als Ergänzungen zu PDF/A-1 (also PDF a-1a und PDF a-1b) gedacht. Hiermit ist eine Langzeitarchivierung auch mit transparenten Objekten, Ebenen sowie mit Seitenskalierung und Open Type Fonts möglich. Diese werden bei PDF/A-2 in einer zentralen Datei gespeichert (dadurch sind auch mehr Schriftzeichen möglich). Die gespeicherten Daten bleiben mit PDF/A-2 immer originalgetreu erhalten und sind einwandfrei reproduzierbar. Auch wenn sie nach langer Zeit und mit anderen technischen Voraussetzungen aufgerufen werden müssen.

Die Unterformate PDF/A-2a, PDF/A-2b und PDF/A-2u unterscheiden sich wie folgt:

  • PDF/A-2a: a steht für accessible (zugänglich); hier geht es vor allem um die Semantik und Struktur des zu speichernden Dokuments
  • PDF/A-2b: b steht für basic; hier steht die eindeutige, visuelle Reproduzierbarkeit im Vordergrund, 2b ist besonders gut für Langzeitarchivierung geeignet; Archivierung von Bildern und Grafiken sind ideal möglich
  • PDF/A-2u: u steht für unicode; das heißt, der Text ist in Unicode abgebildet (später auch ohne Probleme wieder darstellbar), der Level 2u ermöglicht es, dass auch die Wiedergabe in andere Ländern und Schriftkulturen per internationaler Codierung gewährleistet ist

Wichtig: Sowohl die Formate PDF/A-1 als auch PDF/A-2 bleiben auch nach der Einführung von PDF/A-3 gültig. Während Level 1a und 2a für eine Textarchivierung bereits ausreichen, wird für eine Langzeitarchivierung samt Grafiken, Bildern oder Tabellen mindestens Level 1b oder 2b empfohlen. Das hier beschriebene PDF/A-2 Format wird vor allem dann eingesetzt, wenn individuelle Fonts und Bilder verwendet werden. Diese wären in anderen Formaten nicht so einfach archivierbar. Als aktuelles Standardformat gilt PDF/A-3. Mit diesem Format werden wir uns ausführlicher in Teil 3 unserer Blogreihe beschäftigen.