Von PNG zu PDF mit OCR – Kochrezept für MacOS

Bild Jörg Oyen – MacOS X Automator Schnellaktion «Aus Bildschirmfoto PDF mit Textlayer für Volltextsuche per OCR machen» Gelb im Bild hinterlegt die Fundstellen nach der Buchstabenkombi pdf.

Dienste wie der actino.de Document Processing Service (DPS), verarbeiten serverbasiert 24 Stunden und 7 Tage die Woche, eingehende Dokumente zu Anwendungsspezifischen PDF Dateien. Ohne Server, auf MacOS und als Dienst mit der Anwendung Automator einzurichten ist die automatische Umrechnung von Bildschirmfotos zu PDF und in einem weiteren Schritt die Erzeugung von einem Textlayer per OCR für eine spätere Systemweite Volltextsuche.

Wozu ist das ganze gut?

Neben der Reduktion von wertvollen Speicherplatz, lassen sich Momentaufnahmen mit Textinhalten wesentlich schneller, dank Systemweiter Volltextsuche, wiederfinden. Im Arbeitsablauf ändert sich die Dateigröße der PNG mit 2,4 MB als PDF auf 1,4 MB. Nach erfolgter Texterkennung liegt die Größe der Datei bei 828 KB.

Automatisierungs-Kochrezept von PNG zu PDF mit OCR für versierte MacOS Anwender

Jörg Oyen hat in den letzen zwei Wochen, entlang der Frage «Wie komme ich von einer ScreenShoot PNG zu einer PDF mit Textlayer» verschiedene Lösungswege auf Mac OS verfolgt. Herausgekommen ist ein Ablauf für Automator der sich als Schnellaktion oder Dienst über das Finder Menü ausführen lässt.

1. Die Anwendung Terminal starten
Im Terminal folgende ‚Anweisungen‘ per Copy&Paste einfügen und ausführen

1.1 Brew laden
/bin/bash -c „$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)“

1.2 Image Magick laden
brew install imagemagick

1.3 OCRmyDF laden
brew install ocrmypdf

2. Automator Schnellaktion erstellen

2.1 Automator starten

2.2 Neue Schnellaktion

2.3 Schell Skript ausführen
for f in „$@“
do
/usr/local/bin/convert „$f“ „${f%.*}“_pp.pdf
rm $f
done
export PATH=/usr/local/bin:$PATH
for t in „$@“
do
ocrmypdf „${t%.*}“_pp.pdf „${t%.*}“_ocr.pdf
rm „${t%.*}“_pp.pdf
done

2.4 das ganze als ’screen png to ocr pdf‘ speichern

Ausblick

Im Oktober 2021 wird MacOS 12 Monterey erwartet. Für M1 Prozessoren soll es dann eine Funktion Livetext geben, die Text in Bildern direkt nutzen lässt. Die gleiche Funktion wird es für iOS 15 geben.

Apple Livetext