Login
Newsletter
Werbung

Fr, 1. Juli 2016, 10:38

Gemeinschaft::Organisationen

Software Heritage baut ein Archiv freier Software

Software Heritage, eine Initiative des Forschungsinstituts Inria, will den Quellcode aller Softwareprojekte, die unter einer freien Lizenz stehen, archivieren und durchsuchbar machen. Dies soll auch, soweit möglich, die gesamte Historie eines Projekts umfassen.

softwareheritage.org

Die Bedeutung von Software in unserer Zeit kann laut der Free Software Foundation Europe (FSFE) kaum überschätzt werden. Sie ist entscheidend für jede technologische Neuerung und alle Bereiche der Wissenschaft, aber auch allgegenwärtig im Alltag.

Damit ist Software ein Teil des menschlichen Erbes. Doch Software kann auch verschwinden, wenn sie nicht mehr profitabel ist, für veraltet gehalten wird oder keinen Interessenten mehr findet. Um dieses Verschwinden aufzuhalten, hat Inria, das nationale französische Forschungsinstitut für Informatik und angewandte Mathematik, die Initiative Software Heritage ins Leben gerufen. Seit über einem Jahr wurde das Projekt aufgebaut und begann, Quellcode zu sammeln. Da die Nutzer des Archivs in der Lage sein sollen, den Quellcode selbst zu verwenden, kann nur Software mit freien Lizenzen berücksichtigt werden.

Das Software Heritage-Archiv hat bereits Quellcode von über 22,7 Mio. Projekten gesammelt. Sie wurden automatisiert gesammelt und werden stetig aktualisiert. Die über 2,6 Milliarden Quellcode-Dateien werden auf einer redundanten und ausfallsicheren Infrastruktur archiviert und indiziert. Mehrere unabhängige Hashes garantieren nicht nur die Unversehrtheit jeder Datei, sondern ermöglichen auch die Suche über den Hash, derzeit nur über den SHA1-Hash.

Die Software des Archivs selbst wird unter freie Lizenzen gestellt und soll demnächst publiziert werden. Die Weiterentwicklung soll dann in einem Gemeinschaftsprojekt erfolgen. Denn es gibt noch zahllose Nutzungsmöglichkeiten des Archivs, die erst noch implementiert werden müssen. Aktuell kann man nur nach Dateien über ihre SHA1-Summe suchen.

Aktuell besteht das Archiv aus den öffentlichen Repositorien von Github, soweit sie keine Forks sind, den Quellen der Pakete von Debian auf dem Stand von August 2015 und dem Quellcode von GNU ebenfalls auf dem Stand von August 2015. Die Erweiterung des Archivs ist eines der nächsten Ziele.

Die weiteren Ziele sind das Anzeigen der Informationen zur Herkunft jeder Datei, Durchstöbern des gesamten Archivs, eine Volltextsuche und Download-Möglichkeiten. Zudem soll anhand der Daten geforscht werden.

Werbung
Kommentare (Insgesamt: 0 )
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung