Flexible Gestaltung von KI-basierten Prozessen

Barrierefreie PDFs in großem Maßstab zu erstellen, ist jetzt schneller und intelligenter geworden. Die neueste Version der PDFix Produkte bietet eine Docker-basierte Lösung für das automatisierte Tagging –  entwickelt für Workflows mit hohem Volumen. Dieser leistungsstarke Container kombiniert das PDFix SDK mit einem fortschrittlichen KI-Modell zur Layouterkennung, das Tabellen, Abbildungen und Formeln präzise identifizieren kann – selbst in gescannten oder visuell komplexen Dokumenten.

PDFix KI Tagging

Abb. Schematische Darstellung des Ablauf zur Nutzung von KI bei der automatischen Erstellung barrierefreier PDF.

Entwickelt für Accessibility-Experten, Teams zur Dokumentenautomatisierung und Organisationen mit Fokus auf PDF/UA, vereinfacht diese vorkonfigurierte All-in-One-Umgebung die Erstellung vollständig getaggter, standardkonformer PDFs – bei minimalem Einrichtungsaufwand.

Automatisches PDF-Tagging, Templates und MathML

Die Docker-basierte Lösung, die das PaddlePaddle-AI-Modell und die PDFix-Engine nutzt, bietet erweiterte Unterstützung für Formeln, Tabellen und visuelle Strukturen – und ermöglicht eine vollständig automatisierte Pipeline für PDF/UA-Compliance.

Automatisches Tagging mit Paddle – Wendet mithilfe des Paddle-AI-Modells und der PDFix-Layout-Engine automatisch semantische Tags auf PDFs an.

Automatische Erstellung von Layout-Templates – Erzeugt automatisch ein Layout-Template (JSON) aus PDF-Dateien mithilfe von Paddle.

Erzeugung von MathML aus Bilddateien – Konvertiert Formeln aus Bildinhalten in gültiges MathML und gibt die Ergebnisse als XML-Dateien aus.

Einbettung von MathML in Formeltags (Paddle) – Erkennt Formeln in PDFs, nutzt Paddle zur Erstellung von MathML und bettet dieses als zugehörige Datei in das jeweilige Formeltag ein.

KI-gestütztes automatisches Tagging mit PaddlePaddle

Eine präzise Layouterkennung ist entscheidend für automatisches PDF-Tagging und vollständige PDF/UA-Compliance. Während viele Engines auf interne Strukturen angewiesen sind – was bei gescannten PDFs oder visuell komplexen Dokumenten häufig scheitert – unterstützt PDFix nun eine externe, KI-basierte Alternative.

Mit der neuesten Version integriert PDFix das PaddlePaddle-AI-Modell als zusätzliche Option zur Layouterkennung. Paddle analysiert die gerenderte PDF-Seite visuell und erkennt Überschriften, Tabellen, Formeln und andere Strukturen – ähnlich wie ein menschlicher Leser. Anschließend erzeugt es automatisch ein Layout-Template, das eine präzise semantische Tagging-Steuerung ermöglicht.

Diese Methode ist besonders effektiv für:

  • Finanzberichte mit komplexen Tabellen
  • Wissenschaftliche Arbeiten oder Mathematik-Lehrbücher mit Formeln und Abbildungen
  • Gescanntes oder per OCR verarbeitetes PDF-Material

Feinabstimmung der Layouterkennung mit Confidence-Thresholds

Das KI-Modell in PDFix unterstützt zudem eine schwellenwert-basierte Layouterkennung. Damit lassen sich Confidence-Level für Elemente wie Tabellen, Formulare und Abbildungen festlegen. So werden nur Ergebnisse mit hoher Sicherheit berücksichtigt, während unerwünschtes Rauschen herausgefiltert wird.

Auto-Tagging mit Docker und KI-Modellen – einfach bereitstellen und skalieren

Die Lösungen laufen in eigenständigen Docker-Images und lasen sich plattformübergreifend ohne aufwändige Einrichtung bereitstellen. Die Funktionalität ist vollständig in PDFix Desktop integriert oder kann mithilfe des PDFix SDK in automatisierte Dokumentenprozesse eingebunden werden.

Erstellung eigener Workflows zur Layouterkennung

Das integrierte PaddlePaddle-KI-Modell dient als Layouterkennungs-Engine für das automatische Tagging und zeigt, wie sich KI-Modelle direkt in den Workflow integrieren lassen. Ein anderes KI-Modell oder eine andere Engine kann jederzeit als externe Aktion in PDFix eingebunden werden. Im PDFix Marketplace finden sich regelmäßig neue externe Integrationen und Aktionen wie z.B. ganz aktuell Amazon Textract und olmOCR.

Euskirchen, Oktober 2025