Neuer Action Marketplace für die PDF-Bearbeitung von PDFix!

Kombinationen von Aktionen zur Gestaltung individueller Bearbeitungsprozesse

Aktionen für die Stapelverarbeitung. Die neue Version von PDFix erlaubt die Kombination individueller Aktionen zur Automatisierung sich wiederholender Aufgaben. Die Aktionen können aus den Standardfunktionen von PDFix oder externen Programmen bestehen, die über eine Befehlszeile eingebunden werden. Mit Hilfe dieser Pipelines kann die Verarbeitung großer Mengen von PDF-Dokumenten auf jede erdenkliche Art erfolgen.

Abb. Action Marketplace für Tools zur Bearbeitung von PDF

PDFix stellt in seinem Action Marketplace einige Aktionen in Form von Docker Images zur Verfügung. Die Anwender können diese Standardcontainer downloaden und je nach Bedarf in die eigenen Abläufe integrieren. Neben diesen Beispielen können Programme wie der callas pdfaPilot oder die pdfToolbox oder andere CLI Tools eingesetzt werden. Weitere Lösungen gäbe es hier von den Herstellern Appligent, apryse (ehemals PDFlib), Global Graphics Software oder den Alternate Text Creator sowie MakeAccessible für barrierefreie PDF.

„Die Anforderungen an Dokumentenprozesse zur Automatisierung, der Einhaltung von Standards sowie zur Integration steigen stetig.“ so Michael Karbe, Geschäftsführer der Actino Software GmbH. “ Es gibt keinen Hersteller, der alle PDF-Funktionen zur Verfügung stellt. Deshalb ist sehr hilfreich, wenn die unterschiedlichen Tools in einer Pipeline zusammengefasst werden können.“

PDFix Action Marketplace

PDFix stellt exemplarisch verschiedene Docker via Github zur Verfügung, die bei Interesse jederzeit heruntergeladen und genutzt werden können. Dabei ist die Nutzung der PDFix Pipelines nicht vorgegeben. Die Docker können für jeden Prozess verwendet werden. Zum aktuellen Stand können die Anwendungen über eine Befehlszeile lokal angesprochen werden. In Planung ist eine RestAPI zur Nutzung als Webservice.

Auf dem Marktplatz stehen derzeit die folgenden Funktionen zur Verfügung:

Erkennung von Sprachen

Ein Docker-Image, das automatisch die Sprache einer PDF-Datei erkennt.

https://hub.docker.com/r/pdfix/lang-detect

OCR Tesseract

Ein Docker-Image, das gescannten PDF-Dateien mit Hilfe des PDFix SDK und Tesseract OCR eine Textebene hinzufügt.

https://hub.docker.com/r/pdfix/ocr-tesseract

HTML zu PDF/UA

Ein Docker-Image, das HTML-Seiten mit dem PDFix SDK und Google Headless Chrome in PDF/UA-Dateien umwandelt.

https://hub.docker.com/r/pdfix/html-to-pdf

Alt Text Generator

Ein Docker-Image, das automatisch alternative Bildbeschreibungen für PDF-Dateien erzeugt und anwendet.

https://hub.docker.com/r/pdfix/alt-text-vision

Alt-Text-Generator OpenAI

Ein Docker-Image, das mit Hilfe des PDFix SDK und OpenAI automatisch alternative Bildbeschreibungen für PDF-Dateien generiert und anwendet.

https://hub.docker.com/r/pdfix/alt-text-openai

PDF/UA-Prüfung VeraPDF

Ein Docker-Image, das PDFs mit veraPDF, dem von der Industrie unterstützten Open-Source-PDF/UA-Validator, überprüft und die Ergebnisse als HTML-, XML- oder JSON-Berichte speichert. Mit diesem Accessibility Checker können Benutzer die Validierung mit anpassbaren Validierungsprofilen durchführen.

https://hub.docker.com/r/pdfix/validation

Kombinationen von Aktionen zur Gestaltung individueller Bearbeitungsprozesse

PDFix Action Marketplace

Interessante Links

Rechtliches

Social Media