Tux

Postscript- und PDF-Dokumente durchsuchen

Referenten

Frank Hofmann und Thomas Winde

Datum

24.03.2012

Kurzbeschreibung

Postscript und PDF zählen zu den Dokumentformaten, die in der IT-Welt mit am meisten genutzt werden - in der Druckvorstufe, im Dokumentenaustausch, dem Rechnungswesen und in der digitalen Archivierung. Die Struktur beider Dokumentformate ist komplex und eine Suche darin häufig unbefriedigend.

Der Beitrag zeigt aus Anwendersicht, wie in den Formaten erfolgreich gesucht werden kann und welche Metadaten zur Klassifikation durch eine Suchmaschine im Dokument benötigt werden. Vorgestellt wird, welche Möglichkeiten die jeweiligen graphischen Dokumentbetrachter bieten. Mit den Werkzeugen auf der Kommandozeile läßt sich die Recherche geschickt automatisieren.

Manuskript