PDF Compressors mit automatischen Tagging

Mit der neuen Version können Anwender gescannte Dokumente im Rahmen der Texterkennung mit Strukturinformation als PDF oder PDF/A erzeugen. Damit automatisiert Foxit einen großen Teil der sonst manuellen Arbeit, um digitalisierte Dokumente barrierefrei abzubilden.

Immer mehr öffentliche Verwaltungen und Unternehmen aus der privaten Wirtschaft verfolgen das Ziel, sich barrierefrei darzustellen. Hierzu gehört unter anderem das Gestalten von Internetseiten, das in der Barrierefreie-Informationstechnik-Verordnung, kurz BITV, geregelt ist. Der ISO-Standard PDF/UA (Universal Accessibility) hingegen enthält Vorgaben, die einen uneingeschränkten Zugriff auf Inhalte in PDF-Dateien ermöglichen.

Das Erstellen solcher barrierefreien Dokumente ist bei digital erzeugten Schriftstücken vergleichsweise einfach. Mit entsprechenden Vorlagen lassen sich MS-Office- oder InDesign-Dateien automatisiert nach PDF/UA konvertieren. Anders sieht es bei gescannten Dokumenten aus. Sie sind nur Images, bei denen sämtliche Aufbauinformationen – sogenannte PDF-Tags – fehlen. Tags kennzeichnen Überschriften, Tabellen, Bilder inklusive ihrer Beschreibungen, so dass diese vom Fließtext unterschieden werden. Sie bilden die technische Basis, um Dokumente im Hinblick auf ihre Struktur zu beschreiben.

Hier setzt der PDF Compressor an. Er konvertiert gescannte Dokumente in hochkomprimierte PDF-Dateien. Mit der neuen Funktionalität erfasst er zusätzlich im Rahmen der Volltexterkennung – soweit automatisch möglich – die Strukturen und setzt entsprechende Tags.