Webinterface zur Validieren und Konvertierung von/nach PDF/A

Die Technische Universität Berlin hat seit Dezember 2017 die Software pdfaPilot von callas software zur Konvertierung und Validierung von PDF/A-Dateien im Einsatz. Hierfür wurde die Software als Kommandozeilen-Tool in eine Weboberfläche integriert. Diese Implementierung hat die TU Berlin jetzt als Open-Source-Code auf GitHub zur Verfügung gestellt. Unternehmen und Organisationen können ihn von dieser Plattform kostenfrei herunterladen und für eigene Zwecke nutzen. 

Die Technische Universität Berlin zählt mit ihren sieben großen Fakultäten, rund 35.000 Studierenden und mehr als 120 Studiengängen zu den großen, international renommierten und traditionsreichen technischen Universitäten in Deutschland. In ihrem frei zugänglichen digitalen Repositorium “DepositOnce” können Wissenschaftlerinnen und Wissenschaftler Forschungsdaten und Publikationen im Internet zur Verfügung stellen.

Damit Textdokumente, wie beispielsweise die jährlich mehr als 500 Dissertationen, langfristig erhalten bleiben, werden sie in PDF/A abgeliefert. Hierzu stellt die TU Berlin ihren Mitgliedern den Validierungs- und Konvertierungsdienst “PDF/A-Conversion” auf den Webseiten des Servicezentrums Forschungsdaten und Publikationen bereit. Hinterlegt ist eine Weboberfläche, in der die Funktionalität von pdfaPilot integriert ist. Der Dienst erlaubt angemeldeten Mitgliedern der TU Berlin, eine PDF-Datei hochzuladen sowie die Validierung und Konvertierung nach PDF/A.

Zuvor gab es an der TU Berlin keine einheitliche Software, um Dateien nach PDF/A zu konvertieren bzw. zu validieren. “Aufgrund der zahlreichen fehlerhaften Konvertierungen bei den abgelieferten Textdokumenten suchten wir nach einer campusweiten, zuverlässigen Lösung”, sagt Dr. Per Broman, Leiter Online-Dienste & IT-Entwicklung und Stellvertretender Leiter der Hauptabteilung 3 “Elektronische Dienste” der Universitätsbibliothek. “Nach einer Marktrecherche und Produkttests haben wir uns für pdfaPilot von callas software entschieden.” Neben der Funktionalität war es der TU Berlin vor allem wichtig, dass die Software zur Konvertierung und Validierung von PDF/A-Dateien mit veraPDF kompatibel ist. Dabei handelt es sich um einen Open-Source-basierten PDF-Validator, der auf Initiative der Open Preservation Foundation und der PDF Association entwickelt wurde.

“Dadurch, dass die Technische Universität Berlin die Weboberfläche für unser pdfaPilot CLI auf GitHub zur Verfügung stellt, können auch andere Unternehmen mit geschlossenen Benutzergruppen oder Universitäten diese sofort ebenfalls verwenden und sparen sich eigene Entwicklungen”, sagt Dietrich von Seggern, Geschäftsführer der callas software GmbH.  Der Open-Source-Code der TU Berlin steht hier zur Verfügung.