Cassandra spendiert Twitter neue Echtzeit-Services
Kommentare

Über den Sinn und Unsinn von Twitter zu streiten, dürfte sich mittlerweile erübrigen – der Messaging Service ist die Referenz, wenn es um das bereitstellen von 140-Zeichen-Kurznachrichten im Web geht,

Über den Sinn und Unsinn von Twitter zu streiten, dürfte sich mittlerweile erübrigen – der Messaging Service ist die Referenz, wenn es um das bereitstellen von 140-Zeichen-Kurznachrichten im Web geht, noch vor Google Buzz und anderen. Spätestens jedoch, wenn man auf das Geschäftsmodell von Twitter zu sprechen kommt, können sich nur die wenigsten eine Spur Ironie nicht verkneifen – denn ein echtes Geschäftsmodell lag bisher nur im Bereich der Spekulation.

Techtelmechtel

Genau das hat sich jetzt mit einer kleinen Indiskretion auf dem Twitter-Development-Blog geändert.

Our analytics, operations and infrastructure teams are working on a system that uses cassandra for large-scale real time analytics for use both internally and externally. Ryan King, 2010

Ein neuer Analytics-Service für Twitter-User? Zumindest die kleine, ausgewählte Gruppe an Beta-Testern für Twitters (noch) geheime Business-Dienstleistungen dürfte sich demnächst über zusätzliche Services à la Google Analytics für ihre Twitter-Accounts freuen – die Gerüchteküche brodelt bereits vor sich hin.

Ménage à trois

Abseits der Spekulationen gibt es mit der Ankündigung aus dem Development Blog jedoch auch ganz handfeste Neuigkeiten zu vermelden. Zunächt einmal bleibt festzuhalten, dass Twitter auch weiterhin an der MySQL für die Speicherung unserer Tweets festhalten wird. Ob das wirklich als Lob für die MySQL zu verstehen ist, oder nicht vielmehr einem nicht zu unterschätzendem Aufwand für die sonst erforderliche Migration zu danken, steht natürlich auf einem ganz anderen Blatt. Zuletzt hatten der #worldcup, gepaart mit anhaltend starken Anstieg der Nutzerzahlen das System doch arg in die Knie gezwungen, Twitter sah sich zeitweise sogar genötigt, den Zugriff auf seine APIs zu beschränken.

Abhilfe – zumindest in Teilen – soll der Einsatz von Cassandra bringen. Cassandra ist ein skalierbares, nichtrelationales und verteiltes Datenbank-Management-System, dass zunächst bei Facebook entwickelt und dort für die Inbox-Suche verwendet wurde, ehe man das System 2008 als Open-Source-Software der Allgemeinheit zur Verfügung stellte. Im vergangenen Jahr war Cassandra bei Facebook auf über 600 Cores für über 120 TB Daten verantwortlich.

Bei Twitter soll die NoSQL-Datenbank u.a. für die Analyse von Geodaten sowie für die Speicherung und Abfrage von Informationen aus dem laufenden DataMining herangezogen werden – welches ganz nebenbei über die gesamte Userbase läuft. Und auch in kommenden Projekten, bei denen eine groß angelegte Datenspeicherung erforderlich ist, will Twitter die Cassandra zum Einsatz bringen.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -