Cloud-Desaster
26.03.2018, 09:10 Uhr
Bewölkt mit möglichen Ausfällen
Auch Cloud-Dienste sehen sich dem Fehlerteufel gegenüber oder sind von Naturereignissen bedroht. Kurze oder längere Aussetzer sind die Folge. Doch wer die Dienste redundant bezieht, übersteht die Wolkenkapriolen.
Immer mehr IT-Kapazität wandert in die Cloud. Nach einer kürzlich veröffentlichten Studie von Cisco sollen bis 2021 sogar 94 Prozent aller Workloads in Cloud-Umgebungen verarbeitet werden. Doch auch Clouds sind nicht unfehlbar, wie unser Blick zurück zeigt. Kaum ein Provider oder grösserer Online-Dienst, der nicht schon einmal offline war oder Datenverluste beklagen musste. Umso wichtiger ist es, dass aus den Desastern der Vergangenheit die richtigen Lehren gezogen werden.
Auch als Kunde an Redundanz denken
Amazons AWS ist nicht nur der grösste Cloud-Betreiber, sondern auch von den grossen Providern am längsten im Geschäft. Entsprechend häufig sind die Fälle von kleineren und grösseren Ausfällen. Da mittlerweile viele Online- Dienste auf der Infrastruktur von AWS basieren, kann ein Fehler dort grosse Auswirkungen auf diverse namhafte Services haben. Letztes Jahr kam es denn auch bei Amazon zu einem mittleren GAU, als an der US-Ostküste der Speicherdienst S3 während drei Stunden nicht zur Verfügung stand. Die Folge war deshalb so verheerend, weil zahlreiche Internet- Dienste ihre Daten dort gespeichert haben. Zu den berühmtesten gehören Docker, GitHub, Signal, Slack, Adobes Cloud-Dienste, Citrix, Expedia, Salesforce und Nest. Sogar die Service-Status-Seite von Amazon selbst war betroffen.
Klar, der Hauptfehler lag bei AWS. Dieser war zudem manuell: Ein Mitarbeiter hatte sich beim routinemässigen Austausch von Servern bei der Konfiguration vertippt und so wichtige Speichergruppen ausser Betrieb gesetzt.
Dass so viele Anwenderfirmen von diesem Vorfall betroffen waren, geht aber auch teilweise auf deren eigenes Konto. Denn sie haben aus Kostengründen darauf verzichtet, den Storage-Dienst redundant zu beziehen und in einer weiteren Region zu spiegeln – was beim weltweiten Anbieter AWS kein Problem wäre. Zu allem Übel kam hinzu, dass die betroffene Region («US-East-1») jeweils standardmässig gewählt wird, wenn ein neuer Dienst beantragt wird.
Was lernen wir? Auch Cloud-Dienste sollten – zumindest, wenn sie eigene, geschäftskritische Produkte betreiben – ebenfalls redundant bezogen werden. Im genannten Beispiel hätten viele Unternehmen ihre Online-Dienste aufrechterhalten können, wenn sie dies beherzigt hätten. Wie etwa Netflix: Die Video-Streaming-Plattform hat eine Cloud- Architektur aufgebaut, die zwölf AWS-Regionen nutzt. Sollte ein Dienst ausfallen, werden die Ressourcen einfach anderweitig angezapft. Für Netflix lohnen sich wohl die dadurch entstehenden zusätzlichen Cloud-Kosten. Entsprechende Untersuchungen haben gezeigt, dass eine Stunde Ausfall den Provider 200 000 US-Dollar kostet, ganz abgesehen von den Reputationsschäden, wenn die Zuschauer ihre Lieblingsserie gerade nicht anschauen können.