Login
Newsletter
Werbung

Do, 26. Januar 2012, 15:00

OOXML und freie Textverarbeitungsprogramme

Die Fähigkeit von freien Textverarbeitungsprogrammen, OOXML-Dateien korrekt zu lesen, wird untersucht.

Was ist OOXML?

Office Open XML (OOXML) ist ein von Microsoft entwickeltes Dateiformat. Die Dateiendungen sind .docx, .xlsx, .pptx. Dieser Text bezieht sich ausschließlich auf Textverarbeitung und entsprechend auf die Dateiendung .docx. OOXML ist standardisiert in ISO 29500. Microsoft Office 2010 und 2007 benutzt OOXML in einer älteren, nicht mit dem ISO-Standard kompatiblen Version als Standarddateiformat.

Obwohl Microsoft die Niederlage von OOXML gegen ODF auf dem Red Hat Summit 2008 eingestanden hat, haben Dateien mit der Endung .docx einen hohen Verbreitungsgrad. Daher soll die Unterstützung von OOXML in OpenOffice.org verbessert werden.

Wenn es nicht explizit erwähnt wird, wird der Name OpenOffice synonym für OpenOffice.org und dessen Forks LibreOffice, Lotus Symphony und Go-oo verwendet.

Die Problematik

Da in meinem Studiengang über 90% der Studierenden und Professoren Microsoft Office in der Version 2007 oder 2010 verwenden, ist OOXML das gängige Format für den Austausch von Dokumenten. Auf die verschiedenen Versionen von OOXML möchte ich hier nicht eingehen. Im Folgenden beziehe ich mich auf ein mit Microsoft Word 2010 erstelltes Dokument, bei welchem keine weiteren Einstellungen bezüglich der Kompatibilität mit älteren Office-Versionen oder dem ISO-Standard 29500 getroffen wurden.

Natürlich werden auch PDF-Dateien für den Austausch verwendet, jedoch lassen diese sich nur schwer bearbeiten. Dokumente, welche bearbeitet werden sollen, werden in der Regel als OOXML (*.docx) versendet. Aufgrund der großen Zahl von beteiligten Personen ist es mir zu aufwendig, alle Beteiligten davon zu überzeugen, ein anderes Format zum Dokumentenaustausch zu verwenden.

Allgemeine Feststellungen zu alternativen Dateiformaten

Zum Austausch von OOXML-Dateien gibt es zwei alternative Formate, welche jedoch nicht Gegenstand dieses Textes sind. Einerseits gibt es das ODF (Open Document Format), andererseits gibt es die Binärformate von Microsoft (*.doc). Microsoft Office 2010 und 2007 SP1 unterstützen das Open Document Format.

Das Open Document Format ist in Version 1.2 das Standardspeicherformat bei OpenOffice.org. Entsprechend gespeicherte Dateien zeigen beim Öffnen in Microsoft Office ein deutlich verändertes Aussehen. Ähnlich ergeht es verschiedenen anderen Textverarbeitungsprogrammen in Bezug auf ODF. Das Open Document Format in der Version 1.0 ist nach ISO 26300 genormt. Wie sich Dateien nach diesem Standard in Microsoft Office verhalten, entzieht sich meiner Kenntnis.

Eine weitere Alternative für den Dokumentenaustausch ist das ältere Binärformat von Microsoft (*.doc). Dieses kann von Microsoft Office und OpenOffice in der Güte gelesen werden, dass es sich zum Dokumentenaustausch sehr gut eignet. Aus diesem Grund beschränke ich mich auf das Lesen des OOXML-Formates, das Speichern des geänderten Dokuments kann ohne Einschränkungen der Kompatibilität im DOC-Format geschehen.

Der Test

Ich habe ein Dokument in Microsoft Word 2010 erstellt. Das Dokument besteht aus vier Seiten mit jeweils einer Kopf- und einer Fußzeile. Auf der ersten Seite befindet sich verschieden formatierter Text. Auf der zweiten Seite befindet sich ein Bild. Eine eingebettete Microsoft Powerpoint 2010-Folie befindet sich auf Seite 3. Auf Seite 4 ist eine eingebettete Microsoft Visio 2010-Folie. Kopf- und Fußzeile bestehen jeweils aus einer Tabelle. Die Seitenzahl, das Datum und der Pfad zur Datei sind jeweils als Feldfunktion realisiert. Das Bild links in der Kopfzeile dient als Logo. Ich habe diese Formatierungen gewählt, da sie in etwa die Komplexität der in meinem Studium versendeten Dokumente widerspiegelt.

Die Originaldatei im .docx-Format finden Sie hier. Sie ist zusätzlich als PDF verfügbar.

Verwendete Versionen und Programme

Primär habe ich OpenOffice.org und die dazugehörigen Forks Go-oo, Lotus Symphony und LibreOffice getestet. Bei Go-oo wurde die Entwicklung eingestellt und das Projekt ist mit LibreOffice fusioniert. Auf der offiziellen Projektseite wird die letzte Version (3.2.1) nicht mehr angeboten. Jedoch gibt es zahlreiche Spiegelserver, auf denen die entsprechenden Dateien noch zu finden sind. Für Go-oo gibt es keine Sicherheitsaktualisierungen mehr.

IBM Lotus Symphony kann nach einer Registrierung bei IBM heruntergeladen werden. Die Windows-Version ist jedoch auch ohne Registrierung in Download-Portalen verfügbar. Außerdem habe ich Abiword und KWord untersucht. Die entsprechenden Versionen der Programme und die eingesetzte Plattform entnehmen Sie bitte der Tabelle. Neben den eingebauten Formatfiltern habe ich mir Konverter angesehen. Einerseits bietet Microsoft offiziell unter dem Namen »Microsoft Office Compatibility Pack for Word, Excel, and Powerpoint File Formats« (msc) einen Konverter von OOXML in das hauseigene Binärformat an. Hierbei handelt es sich um einen Konverter, welcher nicht, wie die Beschreibung und der Name suggerieren, auch ohne Installation von Microsoft Office in einer älteren Version (2003, XP, 2000) funktioniert. Andererseits gibt es den odf-converter-integrator, einen freier Konverter, welcher OOXML in ODF konvertiert. Der »odf-converter-integrator« baut auf dem Projekt Open XML/ODF Translator Add-ins for Office auf, das einen freien ODF-Filter für MS Office entwickelt.

Der von Sun Microsystems entwickelte, Closed-Source-ODF-Filter für MS Office steht noch in einer älteren Version kostenlos zur Verfügung. Neuere Versionen sind jedoch nicht mehr kostenlos.

Außerdem gibt es ein Plugin für OpenOffice mit dem Namen odf-converter, das bei Novell im Rahmen des Go-oo Projektes entstanden ist. Möglicherweise funktioniert es nur unter Windows. Ob das Plugin mit der aktuell von Novell angebotenen Version identisch ist, habe ich nicht getestet. Genauso entzieht sich meiner Kenntnis, ob das von Novell angebotene Plugin mit neueren LibreOffice-Versionen funktioniert.

Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung