Mit der Anwendung werden „alternative Texte“ für Grafiken und Bilder automatisch erzeugt. Diese Beschreibungen sind zwingende Voraussetzungen bei der Erstellung barrierefreier PDF bzw. PDF/UA und werden durch Screenreader beim Vorlesen einer PDF verwendet. Mit Hilfe von KI werden die Beschreibung in hoher Detailgenauigkeit sowie flexiblen Umfang erzeugt und ersparen die manuelle Eingabe.

Installation

Mit Hilfe des Installer wird die Anwendung mit allen notwendigen Komponenten auf die Festplatte kopiert und kann über die Systemsteuerung bei Bedarf wieder entfernt werden.

Die Ablage der Programmdateien erfolgt in dem Ordner: „C:\ProgramData\Actino Software GmbH\AlternateTextCreator“

Anbindung KI

Zur Erstellung der „alternativen Texte“ wird eine KI via Web API unter strenger Beachtung des Datenschutz genutzt. Aus diesem Grund wird ein Konto für die Nutzung der Web API benötigt. Mit jedem Aufruf werden diese Auftragsdaten übergeben und die Nutzung anhand der Anzahl verbrauchter Token abgerechnet. Die Menge der Token ist letztendlich entscheidend für die Qualität des Ergebnisses.

Vorbereitung der PDF

Die PDF-Dokumente sollten im Vorwege vollständig und standardkonform getaggt werden. Die relevanten Bilder oder Grafiken müssen mit einem „Figure“ Tag versehen werden, da genau dieser Bereich als Bild an die KI übergeben werden.

In dem Screenshot ist Figure Tag zu erkennen und der dazugehörige Bereich auf der Seite. Bitte beachten, dass ein Figure Tag auch mehrere Objekte beinhalten kann, die in der Summe eine Grafik ergeben. Dies ist insbesondere bei Geschäftsgrafiken von Interesse.

Abb. Getaggte PDF, so dass die alternativen Texte automatisch dem Figure Tag hinzugefügt werden können.

Anwendung

Die Applikation wird mit Hilfe einer Befehlszeile wie folgt aufgerufen:

atc.exe –pdf  Input.pdf“ –pdfOut Output.pdf -k KI-Key

Alle weiteren Parameter sind optional. Insgesamt stehen folgende Parameter zur Verfügung:

-i, –pdf –> Vollständiger Pfad zu dem zu bearbeitenden PDF (Required).

-o, –pdfOut –> Vollständiger Pfad zu dem bearbeiteten PDF (Required).

-k, –> KI API-Key für Web API (Required). 

-x, –tagsDelete –> Alle Tags vor der Verarbeitung aus dem PDF entfernen (Default: False). 

-a, –tagsAdd –> Tags vor der Verarbeitung automatisch erstellen (Default: False). 

-l, –outputLanguage –> Ausgabesprache für den alternativen Text wie z.B. DE oder EN (Default: DE). 

-p, -> Hebt den Sprachparameter auf. Pfad zu Textdatei, die Custom KI Prompt beinhaltet (Default: False).

-n, –noAPICall –> Es erfolgt kein API-Call. Es wird lediglich ein Testtext gesetzt (Default: False). 

-u, –saveImages –> Pfad angeben, in dem die gefundenen Bilder gespeichert werden (Default: False).

-t, –> Maximale Anzahl an Token, die zur Erstellung des Text eingesetzt werden (Default 150).

–help –> Anzeige Hilfe (Default: False). 

–version –> Anzeige Versionsinformation (Default: False).

Euskirchen, 2024