Cassandra, HBase, MySQL, Voldemort: Datenbanken für Big Data im Vergleich
Kommentare

In einer groß angelegten Messreihe haben sechs IT-Experten um Tilmann Rabl, Datenbanken auf ihre Big-Data-Tauglichkeit überprüft. Auf dem Testparcours waren HBase, Cassandra, Voldemort, Redis, VoltDB

In einer groß angelegten Messreihe haben sechs IT-Experten um Tilmann Rabl, Datenbanken auf ihre Big-Data-Tauglichkeit überprüft. Auf dem Testparcours waren HBase, Cassandra, Voldemort, Redis, VoltDB und MySQL. Getestet wurde nach fünf verschiedenen Workload-Szenarien: Lesen, Lesen und Schreiben, Schreiben, Schreiben und Scannen sowie Lesen und Schreiben und Scannen.

Unterm Strich geht Cassandra als klarer Sieger hervor. Jedoch erkauft man sich bei dem Facebook-Sprössling den hervorragenden Datendurchsatz mit hohen Latenzen. Auch bei der Skalierung brilliert der verteilte Key-Value-Store: Der Datendurchsatz steigt linear mit der Zahl der Knoten. HBase skaliert ebenfalls sehr gut – was allerdings dringend nötig ist, denn der Datendurchsatz ist bei einem Knoten der geringste, während die Latenzen bei einer großen Anzahl von Zugriffen sehr gering sind. Voldemort positioniert sich zwischen Cassandra und HBase, skaliert linear und weist stabile Latenzen bei unterschiedlichen Auslastungen auf.

MySQL und Redis haben einen zufriedenstellenden Durchsatz, der jedoch nicht mit der Zahl der Knoten skaliert. Bei MySQL hingegen sank die Latenz bei wachsender Verteilung. Bessere Messungen erzielte man mit der Sharding Library YCSB an Stelle von Jedis. So wurden ähnliche Werte wie mit Cassandra erreicht.

In weiteren Messungen will die Arbeitsgruppe testen, wie sich Replikation und Kompression auf den Datendurchsatz auswirken. Außerdem will man den Testparcours um weitere Datenbank-Systeme erweitern.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -