PDFix SDK – PDF automatisiert taggen, Inhalte extrahieren oder konvertieren

Wiederverwendung, Analyse und Aufbereitung für Barrierefreiheit oder HTML-Export

PDFix hat sich auf die strukturierte Bearbeitung und Verarbeitung von PDF Dokumenten spezialisiert. Das SDK erkennt den Aufbau und Strukturen in einer PDF wie z.B. Tabellen und nutzt diese Informationen für Formularprozesse, die Erstellung barrierefreier Dokumente, die Extraktion von Inhalten sowie die Konvertierung in u.a. HTML. Neben dem SDK gibt es mit PDFix Desktop eine Applikation zur lokalen Bearbeitung und Validierung von PDF.

„Es gibt zahlreiche ausgezeichnete SDK für die verschiedenen Prozesse, die mit Hilfe von PDF digitalisiert werden. Die Library von PDFix hat seinen Fokus und seine großen Stärken im Bereich der automatischen Erkennung von logischen Strukturen, die für den Liquid Mode in Acrobat Reader (die responsive Wiedergabe von Inhalten) sowie Barrierefreiheit wesentlich sind.“ so Michael Karbe, Geschäftsführer der Actino Software GmbH.

Funktionsübersicht

Extraktion strukturierter Inhalte

Extrahieren Sie Daten, Texte, Bilder und Tabellen.
Dokumentlayout und Strukturerkennung, Intelligente Datenextraktion.
Text, Bilder, Diagramme, Tabellen, Listenextraktion.
HTML-, HTMl5-, JSON-, Word-, Excel-, CSV- und XML-Konvertierungen.
PDF Structured Data Scraping oder Mining.

Konvertieren von PDF-Dateien in HTML

Konvertieren Sie PDF in HTML, XML, CVS, JSON.
PDF-zu-HTML-Konvertierung im festen Layout oder im Responsive-Layout mit Content Reflow.
Konvertierung in HTML mit oder ohne externe Referenzen.
JavaScript-Unterstützung für PDF-Dokumente.
HTML5-, JavaScript- und CSS3-Unterstützung, PDF in Webseite einbetten.

PDF-Formulare in HTML-Formulare

PDF-Formularen mit Feldvalidierung und -berechnung.
Formulare ausfüllen, PDF-Formular in HTML-Formulare konvertieren.
Verflachen (flatten) und Signieren von Formularfeldern.
Native HTML-Formularunterstützung.
Eingaben, Dropdown-Listen, Kontrollkästchen, Optionsfelder.

PDF-Daten-Scraping

Text in PDF suchen. Tabellen erkennen und exportieren, Anmerkungen extrahieren.
Regulären Ausdruck und Mustervergleich verwenden.
Scrape PDF für Datenanalyse, Big Data, Data Mining, Indizierung, künstliche Intelligenz und maschinelles Lernen.

PDF zu XML

Konvertieren Sie PDF-Dateien in XML.
Bearbeiten Sie die Daten nach Bedarf. Benutzerdefinierte Konvertierungskonfigurationen.

PDF/UA-Konformität

PDF-Dateien automatisch barrierefrei = zugänglich machen.
Tags hinzufügen, zugänglich machen, PDF in PDF/UA konvertieren.
Strukturierte Tags zu PDF-Dateien hinzufügen.
Einhaltung von Barrierefreiheitsstandards, Gesetzen und Vorschriften.

PDF zu CSV

Tabellenränder erkennen, Erkennen Sie Tabellenspalten und -zeilen.
Unstrukturierte PDF-Daten in strukturierte CSV ausgeben.

Wiederverwendung, Analyse und Aufbereitung für Barrierefreiheit oder HTML-Export

Funktionsübersicht

Interessante Links

Rechtliches

Social Media