Visual Studio Online war offline – das verursachte den Ausfall
Kommentare

Fast zwei Wochen ist es nun her, dass Visual Studio Online den größten Ausfall in seiner noch jungen Geschichte erleiden musste. Die Performance der Sammlung von Entwicklerdiensten in der Cloud war so

Fast zwei Wochen ist es nun her, dass Visual Studio Online den größten Ausfall in seiner noch jungen Geschichte erleiden musste. Die Performance der Sammlung von Entwicklerdiensten in der Cloud war so schlecht, dass der Dienst praktisch nicht verfügbar war.

Nach fünf Stunden intensiver Arbeit von Seiten Microsofts lief Visual Studio Online zwar wieder, doch die Entwickler mussten noch weitere drei Tage durchackern, um die mit dem Ausfall in Zusammenhang stehenden Bugs zu beheben. Nachdem nun wieder alles seinen geregelten Abläufen folgt, hat Brian Harry aus dem TFS Team die Zeit gefunden, die Visual-Studio-Online-Nutzer über die Ursachen des Ausfalls zu informieren.

Visual Studio Online: die Ursachen des Ausfalls

Im Vorfeld des Ausfalls hatten die Visual Studio Online Shared-Platform-Services-Datenbanken zahlreiche Updates erhalten, die sich anstauten und so einige Callers blockierten. Außerdem wurden in etwa demselben Zeitrahmen verschiedene Konfigurationsänderungen durchgeführt, die zu einem Traffic-Anstieg zwischen dem TFService und den SPS führten – darunter einige License Validation Checks, die nicht richtig deaktiviert wurden.

Als Auslöser für den Ausfall muss aber der mit diesen beiden Aspekten verbundene rapide Latenzanstieg und die fehlgeschlagenen Deliveries in Services Bus Messages vermutet werden. Endgültige Sicherheit hierüber herrscht bei Microsoft übrigens nicht.

Jedenfalls versuchte das Visual Studio Online nun weiter, die zugrunde liegenden Probleme aufzudecken, die solch einen Crash überhaupt erst möglich machten. Dabei identifizierten zwei gleich zwei Übeltäter:

  1. eine Ansammlung von Bugs, die zusätzliche Arbeit der SPS erzeugten
  2. die allgemeine Performance-technische Instabilität des Systems

An diesen beiden Problemfeldern verspricht Brian Harry mit seinem Team nun verstärkt zu arbeiten und alles daran zu setzen, dass ein derartiger Ausfall wie der vor zwei Wochen aufgetretene nicht mehr vorkommen wird. Außerdem entschuldigt er sich bei allen Nutzern von Visual Studio Online, die unter dem Ausfall zu leiden hatten:

I’m sorry for the problems it caused. 

Aufmacherbild: Television noise von Shutterstock / Urheberrecht: Suzanne Tucker

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -