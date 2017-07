Dokumente digitalisieren und zukunftssicher aufbewahren

Erste Schritte zum papierlosen Büro

Durch das Digitalisieren von Dokumenten lässt sich zum Beispiel eine schnelle Suchfunktion verwirklichen. Daneben kann man Platz sparen, auch wenn nicht alle Papierdokumente gleich entsorgt werden können.

Ziel

Wie jedes Jahr war ich bei meiner Steuererklärung am Verzweifeln. Dutzende Dokumente müssen zusammengesucht werden und hierfür muss erst mal Ordnung im Büro geschaffen werden. Der Stapel an bezahlten Rechnungen, Gehaltsnachweisen, Versicherungsdokumenten und die Auszüge zur Altersvorsorge wollen gelocht und abgeheftet werden. Die Ordner platzen jedoch bereits aus allen Nähten und es müssten neue Ordner her. Allerdings ist dafür auch schon kein Platz mehr im Schrank. Dort stehen noch zehn Jahre alte Rechnungen und nehmen Platz weg. Es sammelt sich einfach zu viel im Laufe der Zeit an. Also die Entscheidung: Die Ordner müssen aussortiert werden - aber was kann weg und was wird noch benötigt und wie soll man in all den Ordnern ein Dokument wiederfinden? Eine schwere Frage - der Plan:

Alte Rechnungen, Bankunterlagen und alles andere was sich ansammelt, aber eventuell noch benötigt wird, wird digitalisiert und anschließend vernichtet.

Verträge, Zeugnisse, Arbeitsverträge, Notarurkunden, Handwerkerrechnungen, steuerlich relevante Dokumente werden im Original aufbewahrt. Zusätzlich werden sie digitalisiert, was später das Auffinden erleichtert. Nur in seltenen Fällen muss wirklich ein Original vorgewiesen werden. Trotzdem sind unbedingt gesetzliche Aufbewahrungsfristen und ähnliches zu beachten.

Alles was sicherlich nicht mehr benötigt wird, wird gleich entsorgt.

Neben der reinen Digitalisierung der Dokumente sollen die Daten über zwei Standorte gespiegelt werden. Das beste Backup hilft uns nichts, wenn es bei einem Wohnungsbrand zusammen mit allen Originalen und der IT verbrennt.

Die verwendete Toolchain soll so aufgebaut sein, dass die Daten betriebssystemunabhängig gelesen werden können - und dies auch noch in vielen Jahren. Damit die Dokumente später wiedergefunden werden können, sollen sie nicht nur über den Dateinamen und die Verzeichnisstruktur zu finden sein, sondern auch per Volltextsuche durchsuchbar.

Ralph Aufbau des geplanten Systems

Als verwendete Betriebssysteme kommen Ubuntu 17.04 auf dem eingebundenen Notebook, Android 7.1 auf dem Smartphone und Debian 8 auf den Servern zum Einsatz. Diese Infrastruktur soll mittels Icinga 2 überwacht werden, so dass frühzeitig ggf. Gegenmaßnahmen ergriffen werden können.

Für diesen Artikel kann ich trotz sorgfältiger Recherche keinerlei Garantien übernehmen. Weder auf der technischen Seite (z.B. Datenverlust) noch auf der rechtlichen Seite (z.B. Aufbewahrungsfristen).

Ein kleiner Hinweis zur Entsorgung von Dokumenten: Es bietet sich an, die Dokumente mit einem Aktenvernichter zur vernichten und nicht einfach in die Papiertonne zu werfen. Gehaltsnachweise und medizinische Gutachten sind doch sehr persönlich und gehen niemanden etwas an.

Der erste Artikel beschäftigt sich damit, wie die Dokumente digitalisiert und geordnet werden, mittels Texterkennung eine Textebene in die PDFs einfügt und die Dokumente per Volltextsuche schnell wiedergefunden werden können.

PDF/A

Ein Problem bei der Archivierung von Dokumenten ist, dass es auch in vielen Jahren noch möglich sein soll, diese zu lesen. So einfach wie es sich anhört, ist dies gar nicht zu realisieren. Word- oder LibreOffice Dokumente sind denkbar schlecht geeignet. Einige Versionssprünge reichen aus und die Dokumente werden nicht mehr so dargestellt, wie dies ursprünglich mal gedacht war. Da mittlerweile meist offene Standards zum Speichern verwendet werden, ist es nicht mehr ganz so brisant wie früher, als noch proprietäre File-Formate für Office-Dokumente üblich waren, denn eventuell gibt es die Software zum Anzeigen des Formates gar nicht mehr bzw. ist auf aktueller Hardware nicht mehr lauffähig. Heute ein Dokument von WordPerfect, StarOffice oder der Lotus SmartSuite zu öffnen, könnte eventuell schwierig werden. Aber auch bei PDF-Dokumenten ist es nicht selbstverständlich, dass diese in mehreren Jahren noch vollständig lesbar sind. Zum Beispiel wenn die Schriftarten nicht eingebettet sind, ist die Darstellung davon abhängig, ob die Schriftart tatsächlich auf dem Zielsystem existiert. Auch ansonsten bieten PDFs diverse Features, welche selbst heute eine betriebsystemübergreifende Darstellung bereits erschweren und in Zukunft zu großen Problemen führen können.

Seit 2005 gibt es deshalb den Standard PDF/A. Diese spezielle PDF-Variante wurde zur Langzeitarchivierung von elektronischen Dokumenten entwickelt und stellt das vermutlich aktuell zukunftssicherste Format dar.