Facebook gibt Big Data Query System Presto frei
Kommentare

Auch noch im Petabyte-Bereich soll Presto skalieren: Die neue Query Engine ist entstanden, als man bei Facebook sah, dass Hadoop MapReduce und Hive alleine nicht mehr ausreichen würden. Also machten sich

Auch noch im Petabyte-Bereich soll Presto skalieren: Die neue Query Engine ist entstanden, als man bei Facebook sah, dass Hadoop MapReduce und Hive alleine nicht mehr ausreichen würden. Also machten sich einige ihrer Entwickler ans Werk und erschufen mit Presto ein neues Query System, das auch dann noch die gesammelten Datenberge gezielt nach bestimmten Infos filtern kann, wenn die nächste Milliarde User sich beim Social Network anmeldet.

Nett wie man bei Facebook ist, hat man Presto freilich auf GitHub unter Apache Lizenz v2 freigegeben. Dort werden auch die Abhängigkeiten der Query Engine aufgelistet:

  • Mac OS X or Linux
  • Java 7, 64-bit
  • Maven 3 (for building)
  • Python 2.4+ (for running with the launcher script)

Den Statements auf der Promotion-Website lässt sich entnehmen, dass man auch bei Dropbox über die Implementierung von Presto nachdenke.

Presto greift bei seinen Querys direkt auf das zugrunde liegende Dateisystem zu: Ob Hive, HBase, HDFS, relationale Datenbanken oder proprietäre Speicher… In nur einem einzigen Presto Query kann man gleichzeitig Daten mehrerer Quellen zusammenführen.

Informationen zum Deployment des neuen Query Systems entnehmt Ihr der Presto-Dokumentation. In der Ankündigung auf Facebook findet Ihr Links zu weiterem Material.

Aufmacherbild: Honeycomb von Shutterstock / Urheberrecht: Darios

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -