Lade Inhalt...

Kompaktenstieg: Das EPUB Format für Programmierer - Eine Basis-Konstruktionsanleitung

von Pascal Schwarz (Autor:in)
37 Seiten
Reihe: Kompakteinstieg, Band 5

Zusammenfassung

Dieses Buch wendet sich an Programmierer, die ihre Software mit einer epub-Exportfunktion ausrüsten möchten und an technisch interessierte Verleger und Autoren, die ein wenig mehr über die Interna dieses Formats erfahren möchten. Das epub-Format ist der de facto-Standard des eBooks. Seine Stärken - und seine Schwächen - zu kennen, ist für jeden von Vorteil, der das Maximum aus seinen eBook machen möchte. Den prinzipiellen Aufbau und den technischen Hintergrund eines epubs zu kennen, ermöglicht die Abschätzung, was in einem eBook machbar ist - und was nicht. Einen Dienstleister schützt dieses Wissen davor, Versprechen abzugeben, die sich später als nicht umsetzbar erweisen.

Leseprobe

Inhaltsverzeichnis


Für wen ist dieses Buch?

Dieses Buch wendet sich an Programmierer, die ihre Software mit einer epub-Exportfunktion ausrüsten möchten und an technisch interessierte Verleger und Autoren, die ein wenig mehr über die Interna dieses Formats erfahren möchten.

Das epub-Format ist der de facto-Standard des eBooks. Seine Stärken - und seine Schwächen - zu kennen, ist für jeden von Vorteil, der das Maximum aus seinen eBook machen möchte.

Es ist keine Anleitung, wie ein Manuskript in ein epub umgewandelt werden kann. Dafür gibt es meine Kompakteinstieg-Bücher Professionelle eBooks erstellen mit Jutoh und Professionelle eBooks erstellen mit OpenOffice und writer2epub.

Warum sich aber mit der technischen Seite des epub-Formats beschäftigen?

Den prinzipiellen Aufbau und den technischen Hintergrund eines epubs zu kennen, ermöglicht die Abschätzung, was in einem eBook machbar ist - und was nicht. Einen Dienstleister schützt dieses Wissen davor, Versprechen abzugeben, die sich später als nicht umsetzbar erweisen.

Die einzige Voraussetzung, die notwendig ist: Sie sollten wissen, was eine XML-Datei ist und wie sie aufgebaut wird. Das ist nicht allzu schwer; es handelt sich dabei um eine Textdatei, die nach einem gewissen Schema aufgebaut ist, so dass die darin enthaltenen Daten von Programmen leicht gelesen werden können. Sollten Sie sich damit nicht genau auskennen, dann finden Sie im Netz reichlich Dokumentation, die Aufbau und Funktionsweise einer XML-Datei erklärt. Mit etwas Neugier und Lust am ausprobieren kommen aber auch Anfänger schnell hinter den Trick.

Wenn Sie planen, die praktischen Beispiele durchzuarbeiten, dann sollten Sie wissen, was eine Kommandozeile ist und wie man mit ihr umgeht. Ich werde die Beispiele zwar gründlich erklären, aber keine Einführung ins Betriebssystem geben.

Um ein standardkonformes epub-eBook zu erzeugen, benötigen Sie nicht einmal Programmierkenntnisse. Die zugehörigen Tools sind kostenlos, die verwendeten Standards sind öffentlich verfügbar (wenn auch sehr umfangreich und für Einsteiger streckenweise unverständlich).

Ich werde deshalb in diesem Buch Schritt für Schritt ein Minimal-eBook im epub-Format aufbauen. Das reicht bereits aus, um die generellen Prinzipien zu erkennen, zu wissen, welche Dateien enthalten und wie diese aufgebaut sein müssen. Von dort aus ist es einfach, weitere Inhalte hinzuzufügen und neue Features einzubinden. Am Ende ist für Sie eine epub-Datei nicht mehr ein mythisches Etwas, das Text anzeigt, sondern der Container, der Ihre Ideen in der von Ihnen gewünschten Form zum Leser bringt.

Fangen wir an!

Was ist eine epub-Datei?

Grob verallgemeinert lässt sich sagen: Ein eBook ist nichts anderes als eine in eine einzige Datei zusammengepackte Website.

Alle Texte, Bilder, Videos, Audiodateien, Fonts, Formatierungsanweisungen und Metadaten liegen in ihren jeweiligen Dateien. Dazu kommt eine Steuerdatei (üblicherweise mit dem Namen content.opf), in der beschrieben steht, welche Datei wohin gehört und in welcher Reihenfolge der eReader sie anzeigen soll.

Das ganze wird in ein Zip-File gepackt, welches nicht auf .zip sondern auf .epub endet - und das wars dann schon.

Damit die verschiedenen Geräte das eBook auch korrekt anzeigen können, muss der Aufbau und der Inhalt gewissen Regeln entsprechen. Diese bilden den epub-Standard.

Welche Standards das sind, steht im nächsten Kapitel.

Welche Standards werden in epub-Dateien verwendet?

Der epub-Standard ist eigentlich eine Zusammenfassung verschiedener, bereits vorhandener Standards. Das sind

  1. IDPF - International Digital Publishing Forum
    http://www.idpf.org/specs.htm

  2. OPS - Open Publication Structure
    http://www.idpf.org/2007/ops/OPS_2.0_final_spec.html

  3. NCX
    http://www.niso.org/standards/resources/Z39-86-2005.html#NCX

  4. OCF - Open Container Format
    http://www.idpf.org/ocf/ocf1.0/download/ocf10.htm

  5. OPF - Open Packaging Format
    http://www.idpf.org/2007/opf/OPF_2.0_final_spec.html

Die oben aufgelisteten Standards beschreiben den Aufbau eines epubs - also welche Datei wohin gehört, und welche Daten sie enthalten muss bzw. kann.

Der Inhalt wird durch folgende Standards reglementiert

  1. DCMI Metadata Terms 2006-12-18 (DC)
    http://dublincore.org/documents/2006/12/18/dcmi-terms/

  2. XHTML 1.1
    http://www.w3.org/TR/xhtml11/

  3. CSS 2.1
    http://www.w3.org/TR/CSS21/

  4. XML 1.0
    http://www.w3.org/TR/xml/

Diese Standards sind sehr ausführlich und umfangreich - aber mir ist kein eReader bekannt, der alle Features unterstützt.

Als Daumenregel gilt: je weniger Features genutzt werden, desto breiter ist die Unterstützung über alle Geräteklassen hinweg.

Das soll Sie nicht davon abhalten, fortgeschrittene Techniken in Ihrem epub einzusetzen. Bestimmte Inhalte lassen sich durch ein eingebundenes Video oder eine Animation besser darstellen als durch seitenlange Texte (ich denke da zum Beispiel an interaktive Schulbücher). Aber Sie müssen sich dann bewusst sein, dass dieser Teil des Buches nur auf einem Tablet oder am PC zu sehen sein wird; eInk-Geräte blenden da meist einen kleinen Hinweis ein, der lautet:

Diese Funktion wird von ihrem Gerät nicht unterstützt.

 

Das epub-eBook in der Minimal-Variante

Package und Container Dateien

Dieser Teil beschäftigt sich mit den vier Dateien

  1. mimetype

  2. container.xml

  3. content.opf

  4. toc.ncx

Diese Dateien beschreiben den Aufbau des eBooks im epub-Format.

Wie ist eine epub-Datei aufgebaut?

Bevor ich hier allzu viele Worte verschwende, zeige ich es lieber an einem Beispiel. Die hier gezeigte HalloWelt.epub ist das kleinstmögliche valide epub.

HalloWelt.epub
│    mimetype

├───META-INF
│        container.xml

└───OEBPS
     │    content.opf
     │    toc.ncx

     └───Text
             section-0001.html

Die vier Dateien mimetype, container.xml, content.opf und toc.ncx beschreiben den Aufbau des epubs; section-00001.html enthält den eigentlichen Text.

Details

Seiten
ISBN (ePUB)
9783739461311
Sprache
Deutsch
Erscheinungsdatum
2019 (Juli)
Schlagworte
Selfpublishing epub Programmierung Medienwissenschaft Kommunikationswissenschaft Kommunikation Medien

Autor

  • Pascal Schwarz (Autor:in)

Pascal Schwarz ist seit über 20 Jahren in der IT tätig und kennt vor allem ein Problem: Wenn Experten auf Laien treffen. Dabei ist Laien das falsche Wort: Sie sind ebenfalls Experten, nur auf anderen Gebieten. In seinen Sachbüchern steht daher eins im Vordergrund: einfach, verständlich und nachvollziehbar die Lösung zu präsentieren, die seine Leser brauchen. Damit sie sich so schnell wie möglich wieder ihren eigentlichen Aufgaben widmen können.
Zurück

Titel: Kompaktenstieg: Das EPUB Format für Programmierer - Eine Basis-Konstruktionsanleitung