Wiederverwendung, Analyse und Aufbereitung für Barrierefreiheit oder HTML-Export

PDFix hat sich auf die strukturierte Bearbeitung und Verarbeitung von PDF Dokumenten spezialisiert. Das SDK erkennt den Aufbau und Strukturen in einer PDF wie z.B. Tabellen und nutzt diese Informationen für Formularprozesse, die Erstellung barrierefreier Dokumente, die Extraktion von Inhalten sowie die Konvertierung in u.a. HTML. Neben dem SDK gibt es mit PDFix Desktop eine Applikation zur lokalen Bearbeitung und Validierung von PDF.

„Es gibt zahlreiche ausgezeichnete SDK für die verschiedenen Prozesse, die mit Hilfe von PDF digitalisiert werden. Die Library von PDFix hat seinen Fokus und seine großen Stärken im Bereich der automatischen Erkennung von logischen Strukturen, die für den Liquid Mode in Acrobat Reader (die responsive Wiedergabe von Inhalten) sowie Barrierefreiheit wesentlich sind.“ so Michael Karbe, Geschäftsführer der Actino Software GmbH.

Funktionsübersicht

Extraktion strukturierter Inhalte

  • Extrahieren Sie Daten, Texte, Bilder und Tabellen.
  • Dokumentlayout und Strukturerkennung, Intelligente Datenextraktion.
  • Text, Bilder, Diagramme, Tabellen, Listenextraktion.
  • HTML-, HTMl5-, JSON-, Word-, Excel-, CSV- und XML-Konvertierungen.
  • PDF Structured Data Scraping oder Mining.

Konvertieren von PDF-Dateien in HTML

  • Konvertieren Sie PDF in HTML, XML, CVS, JSON.
  • PDF-zu-HTML-Konvertierung im festen Layout oder im Responsive-Layout mit Content Reflow.
  • Konvertierung in HTML mit oder ohne externe Referenzen.
  • JavaScript-Unterstützung für PDF-Dokumente.
  • HTML5-, JavaScript- und CSS3-Unterstützung, PDF in Webseite einbetten.

PDF-Formulare in HTML-Formulare

  • PDF-Formularen mit Feldvalidierung und -berechnung.
  • Formulare ausfüllen, PDF-Formular in HTML-Formulare konvertieren.
  • Verflachen (flatten) und Signieren von Formularfeldern.
  • Native HTML-Formularunterstützung.
  • Eingaben, Dropdown-Listen, Kontrollkästchen, Optionsfelder.

PDF-Daten-Scraping

  • Text in PDF suchen. Tabellen erkennen und exportieren, Anmerkungen extrahieren.
  • Regulären Ausdruck und Mustervergleich verwenden.
  • Scrape PDF für Datenanalyse, Big Data, Data Mining, Indizierung, künstliche Intelligenz und maschinelles Lernen.

PDF zu XML

  • Konvertieren Sie PDF-Dateien in XML.
  • Bearbeiten Sie die Daten nach Bedarf. Benutzerdefinierte Konvertierungskonfigurationen.

PDF/UA-Konformität

  • PDF-Dateien automatisch barrierefrei = zugänglich machen.
  • Tags hinzufügen, zugänglich machen, PDF in PDF/UA konvertieren.
  • Strukturierte Tags zu PDF-Dateien hinzufügen.
  • Einhaltung von Barrierefreiheitsstandards, Gesetzen und Vorschriften.

PDF zu CSV

  • Tabellenränder erkennen, Erkennen Sie Tabellenspalten und -zeilen.
  • Unstrukturierte PDF-Daten in strukturierte CSV ausgeben.