Ist KI das Allheilmittel für barrierefreie PDFs?

KI-Modelle erkennen Überschriften, Tabellen und Bilder – aber keine Zusammenhänge. Warum das für Screenreader-Nutzende zum Stolperstein wird und welche Tools trotzdem überzeugen.

Automatisierte Konvertierung von PDF nach PDF/UA

Abb. Automatisierte Konvertierung von PDF nach PDF/UA

Um uns einen aktuellen Überblick zu verschaffen, haben wir verschiedene KI-basierte Lösungen getestet – von Open Source (Paddle) bis zu kommerziellen Angeboten (OpenAI, Textract, Adobe Web API) – und ihre Ergebnisse miteinander verglichen.

Das Fazit vorweg: Ja, es ist inzwischen möglich, mit allen getesteten KI-Systemen vollautomatisch technisch valide PDF/UA-Dateien zu erzeugen, die jeden automatisierten Test wie PAC oder veraPDF bestehen. Aber: Der Teufel steckt im Detail. Die eigentliche Barrierefreiheit steht und fällt mit der semantisch korrekten Erkennung der Inhalte – und hier zeigen sich deutliche Unterschiede.

Bei einfach aufgebauten Dokumenten – etwa ein- oder zweispaltigen Seiten – lieferten alle Systeme ordentliche Ergebnisse. Die Struktur wurde korrekt erkannt und sauber getaggt. Unterschiede traten jedoch bei Kopf- und Fußzeilen sowie Listen auf: Während Open-Source-Lösungen diese oft falsch einordneten, konnte insbesondere Textract von AWS in unseren Tests hier punkten und die Elemente zuverlässig erkennen.

Je komplexer das Layout, desto größer wurden die Qualitätsunterschiede. Bei aufwendig gestalteten Seiten mit vielen Grafiken stießen die Open-Source-Modelle schnell an ihre Grenzen – selbst mit viel gutem Willen waren die Ergebnisse schlicht nicht barrierefrei lesbar. Die kommerziellen Systeme machten hier den etwas besseren Job: Sie erkannten die Objekte meist korrekt, auch wenn die Lesereihenfolge teilweise durcheinander geriet.

Wer selbst experimentieren möchte, kann das ganz einfach tun: Die neue Acrobat-Version mit integrierter Web API oder PDFix Desktop Pro (inklusive Docker Images für Paddle, OpenAI und Textract) bieten passende Werkzeuge, um die KI-Ergebnisse mit eigenen Dokumenten zu testen.

Für Unternehmen und Organisationen heißt das in der Praxis: Noch ist – je nach Dokumententyp – manuelle Nacharbeit unvermeidlich. Zwar lassen sich KI-Modelle prinzipiell weitertrainieren, doch der nachhaltigere Ansatz liegt in der Optimierung der Dokumentenerstellung selbst.

Wer präzise und reproduzierbare Ergebnisse will, kommt derzeit an Templates und semantischer Konfiguration nicht vorbei – sie sind der Schlüssel zu wirklich barrierefreien PDFs.

Euskirchen, November 2025