r17 – flinke Alternative zu Hadoop…
Kommentare

…zumindest für Data-Mining in Datensätzen bis 100 Gigabyte hat sich r17 als Outperformer erwiesen, wie sich jetzt im Vergleich zu einem Benchmark von Pangool herausgestellt hat. Auch die Programmierung

…zumindest für Data-Mining in Datensätzen bis 100 Gigabyte hat sich r17 als Outperformer erwiesen, wie sich jetzt im Vergleich zu einem Benchmark von Pangool herausgestellt hat. Auch die Programmierung einfacher Befehle gestaltet sich mit r17 erheblich simpler als mit Hadoop, Pangool, Crunch oder Cascading.

Den Einsatzbereich sieht Autor Matthew Nourse irgendwo zwischen SQL und Hadoop, sagt er in der Reddit-Diskussion. Datensätze um 100 GB, also die Obergrenze üblicher RDBMSs, sind der Punkt, an dem sich SQL nicht mehr und Hadoop noch nicht rentieren, da SQL hier ihre Skalierungs-Obergrenze überschreitet und Hadoop mit seinem gewaltigen Overhead des Guten zu viel wäre.

Die Data-Mining-Software r17 performt in mittleren Datenbanken erheblich besser als Hadoop und Co. Quelle: rseventeen.com

Details zu der besagten Syntax findet Ihr hier. r17 steht zum Download für diverse Linux-Distributionen, MAC und FreeBSD bereit. Schon bald will Nourse den Quellcode offenlegen.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -