pdf nach html konvertieren ?

Post Reply
Message
Author
tuxic trace

pdf nach html konvertieren ?

#1 Post by tuxic trace »

Ich suche ein Programm, mit dem ich .pdf Dateien nach html konvertieren kann. Eines habe ich für Linux gefunden, das allerdings statt pdf2html besser pdf2png hätte heißen sollen, da es aus den .pdf Dateien "nur" ein png macht.

Jemand eine Alternative für "richtiges" html ?

jascha

Re: pdf nach html konvertieren ?

#2 Post by jascha »

Also mit HTML kann ich nicht dienen, aber es gibt immerhin das Programm pdf2text, das - wie der Name schon verrät - PDFs in Text umwandelt. Funktioniert einfach mit

$pdf2text dateiname.pdf

wenn ich mich richtig erinnere.

Jascha

ratte

Re: pdf nach html konvertieren ?

#3 Post by ratte »

vermutlich wirst du damit kein glueck haben. zwar habe ich adobe's pdf format nicht studiert, jedoch weiss ich, dass als text erscheinende dokumente trotzdem reine grafiken sein koennen. und pdfs, worin der adobe destiller in texten rummachen kann, kostet ein haufen geld, das format ist AFAIK geheim.
im ersten fall brauchst du eine okraware, im zweiten musst du lizenzen kaufen.
womoeglich gips sowas fuer linux, dann aber im proffessionellen bereich fuer kohle.

*umgekehr* wird n schuh draus, html2pdf, aber das hilft dir ja nicht wirklich...

ratte

tuxic trace

Re: pdf nach html konvertieren ?

#4 Post by tuxic trace »

Grummel. Danke - für Windows gibt es ein Programm, das daß (laut Werbung) kann. Ist auch bezahlbar, hat jedoch dieses Plattform Problem, womit das ganze dann nicht mehr bezahlbar ist ...

Wobei ich noch gar nicht überprüft habe, ob denn die .pdfs wirklich Text und keinen "Bildertext" haben. Guter Punkt.

Fabian

Re: pdf nach html konvertieren ?

#5 Post by Fabian »

Die Format-Spezifikation ist IMHO NICHT geheim!

Wie können denn sonst Programme wie Scribus, perfekte Acrobat PDFs herstellen?

Auch xpdf kann glaub ich schon nach Texten suchen und diese markieren. Also hat einfach noch keiner nen Prog implementiert, womit man PDFs einfach bearbeiten kann...

Wobei, dann hätte ich am liebsten nen Input-Filter nach Scribus, da das ja sowieso schon mit Texten und PDFs umgehen kann. (Also ich brauch das nicht wirklich [für all die, die jetzt schreien: Programmier doch selber!])

cu

Fabian

trivialis
Posts: 24
Joined: 08. Apr 2002 18:17

Re: pdf nach html konvertieren ?

#6 Post by trivialis »

Hallo !
Möglicherweise ist meine Antwort nicht wirklich hilfreich, aber wie wäre es, ein unter X angezeigtes PDF-Dokument in eine Postscriptdatei zu drucken und von dort aus weiterzumachen (ps2xy..) ?

Ein Versuch wars wert... Gruß
Trivialis

Post Reply