Text aus PDFs nichts kopierbar

Post Reply
Message
Author
micbur
Posts: 86
Joined: 05. Jun 2004 15:55

Text aus PDFs nichts kopierbar

#1 Post by micbur »

Hallo,

ich habe aus einem PS ein PDF gemacht, weil wir unter Windows nichts haben, womit wir PS anschauen koennen. Leider koennen wir keine Texte aus dem PDF ziehen. Nun habe ich schon einige GS-Parameter probiert, komme aber auf keinen gruenen Zweig.

Hatte jemand dieses Problem schon einmal?

Ciao, micbur

User avatar
hjb
Pro-Linux
Posts: 3264
Joined: 15. Aug 1999 16:59
Location: Bruchsal
Contact:

#2 Post by hjb »

Hi,

PDF ist nicht wirklich dafür geeignet, den Text zu extrahieren. Mit pdf2text kann man es versuchen, aber es ist oft fehlerhaft und kann Textblöcke in der falschen Reihenfolge liefern (vielleicht nur bei mehrspaltigem Text).

Gruß,
hjb
Pro-Linux - warum durch Fenster steigen, wenn es eine Tür gibt?

micbur
Posts: 86
Joined: 05. Jun 2004 15:55

#3 Post by micbur »

Hallo,

das ist irgendwie ärgerlich. Ich dachte immer, dass PS-Files mit LaTeX erstellt werden und dass ist ja eine Zeichensatzsprache. Irgendwo muss da doch noch Text drin sein.

Ich habe mal einen Gegentest gemacht. Ich habe mal ein PDF mit OpenOffice erstellt. Aus diesem PDF kann ich den Text extrahieren, einfach markieren & kopieren, fertig.

Na gut, dann muss das jetzt so gehen.
Vielen Dank.

Ciao, micbur

Post Reply