Weiterentwicklung und Optimierung vom PDF-Format

Das PDF-Format gilt als interoperables Dateiformat, das vor allem durch sein klares und zuverlässiges Erscheinungsbild überzeugt. Zusätzlich bringt das Format allgemein definierte, erwartete Verhaltensweisen in allen Implementierungen mit und wird kontinuierlich angepasst und verbessert. Dazu gehört auch, dass Fehler und Probleme regelmäßig gemeldet werden.

Das soll allen Beteiligten im PDF-Ökosystem, von den PDF-Entwicklern bis zu den Endanwendern helfen. Die Meldung von Problemen und Fehlern, die Arbeit an deren Lösung sowie die Veröffentlichung der entsprechenden Informationen sind ganz entscheidend für die Gewährleistung der Interoperabilität von PDF.

Korrekturen durch die PDF Technical Working Group der PDF Association

Zu erwähnen ist hier in erster Linie die PDF Technical Working Group der PDF Association, welche einen beachtlichen Wissenstand zu allen Fragen rund um PDF zusammengetragen und gelöst hat. Die einfachsten Korrekturen und Klarstellungen reichen von typografischen und Formatierungsfehlern über sprachliche Klarstellungen (wichtig für nicht-englische Muttersprachler) bis hin zur Beseitigung falscher Querverweise.

PDF-Probleme betreffen auch größere Fehler wie fehlende (d.h. bisher nicht dokumentierte) Schlüssel in Wörterbüchern, Änderungen des optionalen/erforderlichen Status bestimmter Schlüssel, Korrekturen zulässiger Schlüsselwerte und sogar die Bereitstellung eines fehlenden Anhangs zu Anhang L (Annex L: Definiert die Beziehung zwischen Tags). Alle diese Änderungen sind für jeden PDF-Entwickler interessant und wichtig.

Jede Lösung verweist auf eine oder mehrere GitHub Issue-Nummern, so dass Entwickler die technischen Diskussionen nachlesen können. Diese Diskussionen sind hilfreich, um mehr über die technischen Hintergründe zu erfahren. PDF-Issues ist eine unschätzbare Quelle an Informationen zu einem breiten Spektrum technischer PDF-Themen.

Nicht nur für PDF 2.0-Spezifikation von Bedeutung

Obwohl die gelösten Probleme als markierte Änderungen an der neuesten PDF 2.0-Spezifikation (ISO 32000-2:2020) dargestellt werden, sind viele Korrekturen auch für frühere PDF-Spezifikationen von großer Bedeutung.

Das liegt daran, dass PDF ein rückwärtskompatibles Format ist und viele Formulierungen aus früheren PDF-Spezifikationen beibehalten oder nur leicht angepasst wurden. Die Nummerierung der Klauseln ist zwischen PDF 1.7 (ISO 32000-1:2008) und PDF 2.0 (ISO 32000-2:2020) weitgehend unverändert geblieben. PDF-Entwickler sind daher leicht in der Lage, solche Korrekturen zu identifizieren und auf frühere Spezifikationen zurückzuführen, die für ihre Implementierungen relevant sind.

GitHub-Repository pdf-issues

Die PDF Technical Working Group (TWG) der PDF Association trifft sich regelmäßig, um gemeldete Probleme zu prüfen und diejenigen mit identifizierten Lösungsvorschlägen zu genehmigen. PDF-Entwickler sollten daher das entsprechende GitHub-Repository pdf-issues immer im Auge behalten und sich aktiv an den Diskussionen über alle für sie relevanten Probleme beteiligen. Denn wenn Sie an PDF-Entwicklung beteiligt sind, sollten Sie in jedem Fall auf dieses PDF-Korrekturverzeichnis zurückgreifen. Und die PDF Association gibt ganz klar den Hinweis: Jeder Fehlerbericht ist willkommen, egal wie klein er ist! Bitte tragen Sie dazu bei, indem Sie neue Themen erstellen:

https://github.com/pdf-association/pdf-issues

Überarbeitung der PDF Forms Technologie

Ein Beispiel für weitere Detailverbesserungen ist die jüngste Ankündigung, dass die PDF-Formulartechnologie angepasst werden soll. Die PDF Forms Technical Working Group arbeitet an einem Vorschlag zur Weiterentwicklung von PDF-Formularen, um einige Probleme zu lösen, die im Laufe der Jahre festgestellt wurden. 

Ein wichtiger Aspekt dieser Arbeit ist der vorgeschlagene Wechsel von einer Skriptsprache ohne vollständig dokumentiertes Verhalten zu einem deklarativen Modell für die Geschäftslogik und die Regeln für das Formular. Diese Änderung würde nicht nur Berechnungen, sondern auch Formatierung und Validierung umfassen.

Ein zweites wichtiges Vorhaben der Gruppe besteht darin, die Fähigkeiten von PDF-Formularen mit denen des Web zu aktualisieren, so dass die Konvertierung von HTML nach PDF oder die Ableitung von PDF nach HTML so verlustfrei wie möglich erfolgt. Darüber hinaus soll die Unterstützung für moderne Webtechnologien wie JSON für die Datenmodellierung und den Datenaustausch eingeführt werden. Hinzu kommt, dass die Zugänglichkeit von PDF-Formularen, insbesondere in den Bereichen Feldbeschriftungen und Feldgruppierungen, verbessert werden soll:

Quelle mit allen wichtigen Links zu GitHub: