Login
Newsletter
Werbung

Do, 5. September 2013, 11:41

Software::Netzwerk

Big Data: Apache Foundation veröffentlicht Cassandra 2.0

Die Apache Software Foundation hat die Version 2.0 der verteilten NoSQL-Datenbank Cassandra freigegeben, die jetzt auch Trigger und Transaktionen unterstützt.

Apache Software Foundation

Das Cassandra-Projekt wurde ursprünglich von Facebook gestartet, wird aber seit nunmehr fünf Jahren unter dem Dach der Apache Software Foundation weiterentwickelt und heute zum Beispiel beim CERN sowie bei HP, IBM, Sony, Adobe, eBay, Instagram oder Netflix eingesetzt.

Cassandra wurde entwickelt, um auch große Datenmengen sehr schnell in einem Cluster zu speichern. Cassandra arbeitet vollständig verteilt, so dass es keinen Single Point of Failure gibt. Dazu skaliert die Datenbank mit steigender Anzahl an Cluster-Knoten nahezu linear und ist damit in der Lage, tausende Anfragen pro Sekunde abzuwickeln. Apache Cassandra 2.0 ist unter der Apache-Lizenz 2.0 lizenziert und lässt sich von der Apache Cassandra-Projektseite herunterladen. Es gibt inzwischen aber auch eine kommerzielle Cassandra-Distribution von der Firma Datastax.

Die neue Version 2.0 von Cassandra kann mit zahlreichen neuen Funktionen aufwarten. So beherrscht sie unter anderem schlanke Transaktionen und Trigger. Schlanke Transaktionen dienen dazu, Operationen zu linearisieren. Die Funktion lässt sich mit der Serialisierung bei relationalen Datenbanken vergleichen und dient dazu, Konflikte bei gleichzeitigen Anfragen zu verhindern. Trigger ermöglichen es, geschwindigkeitskritischen Code nah an den Daten auszuführen. Ferner vereinfachen Trigger die Integration mit ereignisgesteuerten Frameworks wie Storm.

Darüber hinaus bringt Cassandra einige Erweiterungen für die eigene Abfragesprache CQL mit, die sich an SQL anlehnt. CQL und die neuen Erweiterungen sollen unter anderem das Umstellen von relationalen Datenbanken auf Cassandra erleichtern und beschleunigen. CQL unterstützt in der neuen Version Cursor. Ferner haben die Entwickler die Index-Unterstützung und die sogenannte Compaction verbessert. Das soll Geschwindigkeitseinbrüche bei Leseanfragen verhindern. Dabei löscht die Compaction die vorher zum Löschen markierten Daten tatsächlich und gibt den Speicherplatz wieder frei. Dieses Vorgehen ist unabdingbar, weil Cassandra beim Schreiben von Daten einen Append-Only-Ansatz verfolgt. Das bedeutet, dass neue Daten ausschließlich an das Ende einer Datei angefügt werden, was eine möglichst konstant hohe Schreibrate ermöglicht. Die mit Cassandra 2 eingeführte Single-Pass-Compaction ist laut Angabe der Entwickler doppelt so schnell wie die bisherige. Kann ein Knoten einen Request nicht schnell genug beantworten, wird dieser an andere replizierende Knoten weitergereicht, wodurch Abfrage-Timeouts verhindert werden sollen. Zudem sorgt ein eigener Thrift-Server auf Basis von LMAX Disruptor für geringere Latenzen und einen erhöhten Datendurchsatz.

Werbung
Kommentare (Insgesamt: 0 )
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung