Login
Newsletter
Werbung

Mo, 20. Juli 2015, 09:12

Gemeinschaft

Speichersystemprobleme bei Sourceforge

Die Projekt-Hosting-Plattform Sourceforge ist bereits seit letzten Donnerstag nur eingeschränkt erreichbar. Alle Dienste waren zeitweise abgeschaltet und werden nach und nach wieder hergestellt. Als Ursache gibt der Betreiber eine Datenkorruption im Speichersystem an.

Die Startseite von SourceForge

Patrick Meyhöfer

Die Startseite von SourceForge

Die Probleme bei Sourceforge (SF) begannen letzten Donnerstag. Zwar blieben die Startseite und Teile der Projektseiten erreichbar, Downloads hingegen scheiterten und andere Dienste waren nicht mehr verfügbar. Informationen über eventuelle Probleme waren auf der Seite nicht zu finden, nur wer die Twitter-Seite von SF aufsuchte, konnte Näheres erfahren.

Der Twitter-Seite kann man entnehmen, dass die Probleme am Freitag so gravierend wurden, dass SF zuerst in den nur lesenden Modus und später, nach Entdeckung eines »Fehlers in der Speicherplattform«, in den Notbetrieb geschaltet wurde. Seither arbeiten die Teams bei SF nach eigenen Angaben rund um die Uhr an der Prüfung und Wiederherstellung der Daten. Inzwischen sind Teile der Dienste wieder online, Downloads sollen wieder möglich sein und Slashdot wurde wieder hergestellt.

Das Team von Slashdot Media, das sowohl für Slashdot als auch für SF verantwortlich ist, hat nun in einem Blogbeitrag die Ereignisse zusammengefasst. Während über die Ursache des Zusammenbruchs noch nicht viel gesagt werden kann, gibt der Beitrag auch Einblicke in die gegenwärtige Infrastruktur des Unternehmens.

Sourceforge ist eine Projekt-Hosting-Plattform, die auf dem Code beruht, den SF unter dem Namen Allura freigegeben und an die Apache Software Foundation übergeben hat. Die Infrastruktur von SF beruht fast komplett auf freier Software. Die Server laufen mit CentOS und nutzen Virtualisierung, was zu einer Reduktion der physischen Rechner um 75% führte. Die Speicherplattform beruht auf Ceph, worüber die Dateisysteme ext4, XFS und NFS eingesetzt werden. Es wird eine freie Cloud-Backup-Lösung eingesetzt. Daten werden in MongoDB, MySQL und PostgreSQL gehalten. Die Suche wird mit Hadoop und ElasticSearch realisiert. Slashdot ist in Perl, Sourceforge (Allura) hingegen in Python geschrieben.

Wie Sourceforge weiter schreibt, wurde der Ausfall durch eine Datenkorruption im erwähnten Ceph-Cluster verursacht. Genaues dazu ist noch nicht bekannt, doch waren offenbar alle angeschlossenen Festplatten und SSDs betroffen. Bei der Wiederherstellung will SF methodisch vorgehen und auf das letzte korrekte Backup sowie geprüfte Daten aus dem Speichersystem zurückgreifen. Die Wiederherstellung kostet insbesondere durch die Integritätsprüfung der Daten viel Zeit, so dass auch jetzt erst ein Teil der Dienste wieder verfügbar ist. Weitere Dienste sollen bis Mittwoch wieder zugänglich sein. Mit der vollständigen Wiederherstellung der Seite kann erst nach der Wochenmitte gerechnet werden.

Werbung
Kommentare (Insgesamt: 5 || Alle anzeigen )
Funktionalität weitgehend wieder hergestellt (usera, Sa, 1. August 2015)
Re[3]: dauert immer noch an (1ras, Mi, 22. Juli 2015)
Re[2]: dauert immer noch an (irgendwer, Mi, 22. Juli 2015)
Re: dauert immer noch an (1ras, Di, 21. Juli 2015)
dauert immer noch an (Unerkannt, Di, 21. Juli 2015)
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung