Kombinationen von Aktionen zur Gestaltung individueller Bearbeitungsprozesse
Die neue Desktopversion von PDFix erlaubt die Kombination individueller Aktionen zur Automatisierung sich wiederholender Aufgaben. Die Aktionen können aus den Standardfunktionen von PDFix oder externen Programmen bestehen, die über eine Befehlszeile eingebunden werden. Mit Hilfe dieser Pipelines kann die Verarbeitung der PDF-Dokumente auf jede erdenkliche Art erfolgen.
PDFix stellt in seinem Action Marketplace einige Aktionen in Form von Docker Images zur Verfügung. Die Anwender können diese Standardcontainer downloaden und je nach Bedarf in die eigenen Abläufe integrieren. Neben diesen Beispielen können Programme wie der callas pdfaPilot oder die pdfToolbox oder andere CLI Tools eingesetzt werden. Weitere Lösungen gäbe es hier von den Herstellern Appligent, apryse (ehemals PDFlib), Global Graphics Software oder den Alternate Text Creator sowie MakeAccessible für barrierefreie PDF.
„Die Anforderungen an Dokumentenprozesse zur Automatisierung, der Einhaltung von Standards sowie zur Integration steigen stetig.“ so Michael Karbe, Geschäftsführer der Actino Software GmbH. “ Es gibt keinen Hersteller, der alle PDF-Funktionen zur Verfügung stellt. Deshalb ist sehr hilfreich, wenn die unterschiedlichen Tools in einer Pipeline zusammengefasst werden können.“
PDFix Action Marketplace
PDFix stellt exemplarisch verschiedene Docker via Github zur Verfügung, die bei Interesse jederzeit heruntergeladen und genutzt werden können. Dabei ist die Nutzung der PDFix Pipelines nicht vorgegeben. Die Docker können für jeden Prozess verwendet werden. Zum aktuellen Stand können die Anwendungen über eine Befehlszeile lokal angesprochen werden. In Planung ist eine RestAPI zur Nutzung als Webservice.
Auf dem Marktplatz stehen derzeit die folgenden Funktionen zur Verfügung:
- Erkennung von Sprachen
Ein Docker-Image, das automatisch die Sprache einer PDF-Datei erkennt.
https://hub.docker.com/r/pdfix/lang-detect
- OCR Tesseract
Ein Docker-Image, das gescannten PDF-Dateien mit Hilfe des PDFix SDK und Tesseract OCR eine Textebene hinzufügt.
https://hub.docker.com/r/pdfix/ocr-tesseract
- HTML zu PDF/UA
Ein Docker-Image, das HTML-Seiten mit dem PDFix SDK und Google Headless Chrome in PDF/UA-Dateien umwandelt.
https://hub.docker.com/r/pdfix/html-to-pdf
- Alt Text Generator
Ein Docker-Image, das automatisch alternative Bildbeschreibungen für PDF-Dateien erzeugt und anwendet.
https://hub.docker.com/r/pdfix/alt-text-vision
- Alt-Text-Generator OpenAI
Ein Docker-Image, das mit Hilfe des PDFix SDK und OpenAI automatisch alternative Bildbeschreibungen für PDF-Dateien generiert und anwendet.
https://hub.docker.com/r/pdfix/alt-text-openai
- PDF/UA-Prüfung VeraPDF
Ein Docker-Image, das PDFs mit veraPDF, dem von der Industrie unterstützten Open-Source-PDF/UA-Validator, überprüft und die Ergebnisse als HTML-, XML- oder JSON-Berichte speichert. Mit diesem Accessibility Checker können Benutzer die Validierung mit anpassbaren Validierungsprofilen durchführen.
https://hub.docker.com/r/pdfix/validation