Postscript- und PDF-Dokumente durchsuchen
Referenten
Frank Hofmann und Thomas Winde
Datum
24.03.2012
Kurzbeschreibung
Postscript und PDF zählen zu den Dokumentformaten, die in der IT-Welt mit am meisten genutzt werden - in der Druckvorstufe, im Dokumentenaustausch, dem Rechnungswesen und in der digitalen Archivierung. Die Struktur beider Dokumentformate ist komplex und eine Suche darin häufig unbefriedigend.
Der Beitrag zeigt aus Anwendersicht, wie in den Formaten erfolgreich gesucht werden kann und welche Metadaten zur Klassifikation durch eine Suchmaschine im Dokument benötigt werden. Vorgestellt wird, welche Möglichkeiten die jeweiligen graphischen Dokumentbetrachter bieten. Mit den Werkzeugen auf der Kommandozeile läßt sich die Recherche geschickt automatisieren.
Manuskript
- PDF-Version (999 kB)