Login
Newsletter
Werbung

Do, 6. August 2015, 15:00

Mit LaTeX zum E-Book

Besonderheiten eines E-Books

Auch wenn die meisten Leser sicherlich schon einmal ein Buch aus Papier in den Händen gehalten haben, ist man sich oft der Eigenschaften, die so ein Buch mitbringt, nicht bewusst. So gibt es feste Seiten, in der Regel mit Seitenzahlen am Rand oder in den Ecken. Rand? Genau, einen Rand um den eigentlichen Textkörper gibt es auch. So kann man das Buch mit den Händen festhalten, ohne dass der Text verdeckt wird. Oder man kann Kommentare mit einem Stift an den Seitenrand schreiben. Für ältere Menschen ist dieses feste Format aber eher schlecht. Die Schriftgröße verschiedener Bücher ist oft viel zu klein, sodass man sich externer Hilfen wie Lupen bedienen muss. Diese Eigenschaften treffen natürlich nicht nur auf gedruckte Bücher zu, sondern auch teilweise auf »starre« digitale Formate, wie z.B. das PDF.

Ein ebook-latex dagegen ist nicht starr. Ganz im Gegenteil kann man es sogar als »fließend« bezeichnen. Die Schriftgröße oder auch die Schriftart lassen sich oft so einstellen, dass man ohne Probleme auch bei einer Sehschwäche lesen kann. Man kann in einem E-Book zwar auch von Seite zu Seite blättern, dabei sind die Seitenzahlen aber nicht fest. Sie richten sich danach, wie groß der Text auf einer einzelnen Seite ist. Je nach Darstellungsart hat ein Buch also bei einem Leser 100 Seiten und bei einem anderen vielleicht 150.

Ein weiterer Unterschied zwischen E-Books und Büchern ist die Möglichkeit der Verlinkung und der Suche. In der analogen Welt muss man sich mit einem Index zufrieden geben und hoffen, dass der Autor alle wichtigen Stellen indiziert hat. Ansonsten ist viel Blättern angesagt. Bei digitalen Formaten dagegen kann man von einem Index über Links direkt an die gewünschte Stelle im Buch springen oder auch einfach den ganzen Text in Sekundenbruchteilen durchsuchen.

Warum nicht das PDF nutzen?

Auf den meisten E-Book-Readern kann man auch direkt PDFs lesen. Wieso also nicht das von LaTeX erstellte PDF-Dokument auf dem Reader lesen? Der Grund ist, dass PDF wie oben erwähnt ein starres Format ist. Das heißt, der E-Book-Reader zeigt eine ganze Seite an, die in der Regel in DIN A4 erstellt wurde. Würde man auf einem kleinen Display die ganze Seite anzeigen, könnte man nichts mehr erkennen. Wenn man also etwas lesen will, muss man in den Text zoomen und ggf. sehr oft hin- und herscrollen, was bei den meisten E-Book-Readern keinen großen Spaß macht.

Insgesamt gehen mit einem PDF viele Vorteile von mobilen Formaten verloren, weswegen EPUB das bevorzugte Format ist. Dieses hat sich in den letzten Jahren als dominierend erwiesen und so gut wie alle Hersteller von E-Book-Readern verstehen dieses Format.

EPUB ist ein gepacktes Container-Format, in welchem man die XHTML-kodierten Dateien (wie bei gewöhnlichen Webseiten) findet, welche den Text sowie die Formatierung angeben. Daneben enthält der Container natürlich auch die anzuzeigenden Bilder sowie im EPUB3-Standard auch noch Audio- und Videoelemente. Zusätzlich kann man auch noch ein Inhaltsverzeichnis und andere Meta-Daten (wie Autoren, Herausgeber etc.) in dem Container ablegen. Da ein EPUB also intern auch nur aus HTML-Seiten besteht, drängt sich der Weg über eine HTML-Wandlung geradezu auf.

Die Konvertierung des PDF in HTML sieht unschön aus und viele Formatierungen gehen verloren

Dominik Wagenführ

Die Konvertierung des PDF in HTML sieht unschön aus und viele Formatierungen gehen verloren

Naive Wandlung des PDFs als E-Book

Wenn man das Beispieldokument in ein PDF übersetzt hat, kann man versuchen, dieses direkt in ein EPUB oder in HTML zu wandeln. Dies geht beispielsweise über

$ pdftohtml beispiel.pdf beispiel.html -noframes

Das Ergebnis ist dabei aber nicht wirklich ansehnlich: Es fehlen Absätze und Einrückungen, Formatierungen gehen verloren und Seitenzahlen werden in den Text gedruckt, obwohl es gar keine Seiten mehr gibt.

Eine Alternative ist das bekannte Konvertierungsprogramm Calibre. Dabei ist Calibre selbst eher ein Medienverwaltungsprogramm, welches aber zahlreiche Hilfsmittel und Skripte mitbringt. Eines davon, ebook-convert, beherrscht viele Wandlungen, unter anderem auch PDF nach EPUB:

$ ebook-convert beispiel.pdf beispiel.epub

Öffnet man das entstandene EPUB (zum Beispiel mit dem Calibre beiliegenden Programm ebook-viewer oder auf dem E-Book-Reader) bietet sich ein ähnliches Bild wie bei pdftohtml: Einrückungen und Formatierungen gehen teilweise verloren und die PDF-Seitenzahl unterbricht den Lesefluss.

Die Wandlung des PDFs nach HTML beziehungsweise EPUB bietet sich also nicht an. Zu viele Informationen gehen durch die PDF-Elemente verloren, die in LaTeX noch zu finden sind. Daher ist die Idee, das LaTeX-Dokument direkt ohne Umwege zu wandeln.

Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung