Login
Newsletter
Werbung

Do, 6. Februar 2014, 15:00

Die PDF-Werkstatt für Linux

Aus Bildern PDFs backen: Gscan2pdf kann Bilderserien einlesen, sortieren und ein PDF erstellen. Die optionale Texterkennung benötigt ein externes Programm wie Tesseract-OCR

David Wolski

Aus Bildern PDFs backen: Gscan2pdf kann Bilderserien einlesen, sortieren und ein PDF erstellen. Die optionale Texterkennung benötigt ein externes Programm wie Tesseract-OCR

Gscan2pdf: Aus Bildern PDFs erzeugen

Wenn das Material für ein PDF nicht als Text vorliegt, sondern als Einzelbilder, was beispielsweise bei eingescannten Dokumenten der Fall ist, hilft das kompakte Programm Gscan2pdf weiter. Es bietet eine einfache grafische Oberfläche zum Einlesen und Sortierung von Seiten.

In Verbindung mit einer optionalen Texterkennung (OCR) wie Tesseract-OCR kann Gscan2pdf zudem versuchen, Scans in Texte umzuwandeln. Generell ist das Tool aber auch einfach zur Erzeugung von PDFs aus Bildern nützlich.

Installation: Das Programm gehört bei den meisten Distributionen zur leicht nachrüstbaren optionalen Ausstattung. Über die Paketmanager von Debian, Ubuntu, Fedora installieren Sie dazu das gleichnamige Paket »gscan2pdf«. Für Open Suse gibt es ein fertiges Einzelpaket zur Installation unter http://software.opensuse.org/package/gscan2pdf.

Verwendung: Nach dem Aufruf von Gscan2pdf laden Sie über das Öffnen-Symbol in der oberen Menüleiste die gewünschten Bilder, wobei Sie im Dateidialog auch gleich mehrere auswählen können. In der linken Leiste lassen sich die Einzelseiten per Ziehen und Ablegen neu sortieren. Ein fertiges PDF erhalten Sie dann über das Speichern-Symbol.

Suchen und finden: Pdfgrep funktioniert ähnlich wie Grep, ist aber für PDF-Dateien maßgeschneidert. Die Optionen entsprechen weitgehend jenen von Grep

David Wolski

Suchen und finden: Pdfgrep funktioniert ähnlich wie Grep, ist aber für PDF-Dateien maßgeschneidert. Die Optionen entsprechen weitgehend jenen von Grep

Pdfgrep: Textsuche in PDF-Dateien

Für die Archivierung und Volltextsuche in PDF-Dokumenten bieten sich unter Linux Desktop-Suchmaschinen wie Recoll und Tracker an, die einen Index der Dateien und deren Inhalt aufbauen und pflegen. Diese Suchmaschinen stehen aber nicht immer zur Verfügung. Wer mal eben nur in einer Reihe von PDF-Dateien eine Textstelle finden will, braucht zusätzlich ein schlankes und schnelles Tool wie Pdfgrep. Das Kommandozeilenprogramm orientiert sich in seiner Funktion am bekannten Grep, durchsucht aber nur PDF-Dateien.

Installation: Alle populären Distributionen kennen Pdfgrep in ihren Paketquellen, auch Opensuse. Es lässt sich ganz einfach aus den Standard-Repositories mit dem jeweiligen Paketmanager über das Paket mit gleichem Namen nachrüsten.

Verwendung: Als Kommandozeilen-Tool ist Pdfgrep genauso wie das normale Grep eine Sache für das Terminal-Fenster. Angenommen, Sie möchten alle PDFs im Ordner /home/benutzer/archiv nach dem Ausdruck Wo ist das Wort durchsuchen, dann wechseln Sie in der Shell mit

cd /home/benutzer/archiv

in dieses Verzeichnis und geben dort den Befehl

pdfgrep "Wo ist das Wort" *

ein. Genauso wie Grep unterstützt auch Pdfgrep reguläre Ausdrücke sowie wichtige Optionen wie -i für eine Suche ohne Berücksichtigung der Groß- und Kleinschreibung.

Druckertreiber: PDFs einfach erzeugen

Einige der Linux-Platzhirsche wie Libre Office, Apache Open Office, Inkscape und Gimp können Dokumente direkt als PDF speichern und brauchen dafür weder Plugins noch Extra-Tools.

Aber auch unabhängig davon gibt es unter Linux eine einfache Methode, PDFs aus fast beliebigen Anwendungen heraus über die Druckfunktion zu erzeugen. Denn diese arbeitet sowieso mit dem Format Postscript, das sich leicht nach PDF konvertieren lässt. Über einen virtuellen Drucker werden dazu die Daten aus der Anwendung heraus erst in die Beschreibungssprache Postscript umgewandelt, dann aber nicht zu einem tatsächlichen Drucker geschickt, sondern in eine PDF-Datei geschrieben.

Diese Fähigkeit bringen Ubuntu & Co., Debian, Open Suse und Fedora bereits mit, und es muss dazu nicht mal das Drucksystem Cups installiert sein. In einer Anwendung gehen Sie dazu einfach auf die Druckfunktion und wählen dann im Druckdialog den Eintrag In Datei drucken.

Bei Distributionen, die den PDF-Drucker nicht vorinstalliert mitbringen, hilft aber auch Cups weiter: Das Paket »cups-pdf«, welches in den Paketquellen von Ubuntu, Debian und Fedora enthalten ist sowie unter http://software.opensuse.org/package/cups-pdf für Open Suse bereitsteht, bietet ebenfalls einen PDF-Drucker, der allerdings über Cups funktioniert.

Jede Anwendung, die Cups nutzt, um Dokumente zum Drucker zu schicken, kann damit ebenfalls PDFs erstellen.

Dieser Artikel stammt von unserem Kooperationspartner PC-WELT.

Pro-Linux
Traut euch!
Neue Nachrichten
Werbung