Facebook, Whatsapp und Instagram waren seit gestern Abend ca. 18 Uhr Schweizer Zeit komplett offline. Der Fehler wurde, wen wunderts, von den Kids zuhause sofort gemeldet.
Nachdem ich sichergestellt hatte, dass es nicht am eigenen WLAN oder Netzwerk liegt, wurde der Fehler bereits überall in den Nachrichten gemeldet. Es waren die drei sozialen Netze Facebook, Whatsapp und Instagram weltweit davon betroffen und weltweit down. Facebook-Techniker starteten anscheinend die Router der Firma neu und nach gut sechs Stunden offline, waren die Dienste für viele User wieder erreichbar.
In der Schweiz kamen die drei Social Media Dienste heute Vormittag wieder zum laufen.
Was genau die Mega-Störung auslöste, gab Facebook erst Stunden später nach der Problembehebung bekannt. In einer Stellungnahme entschuldigte sich Santosh Janardhan (Vize-Präsident für Infrastruktur) erst für die «Unannehmlichkeiten» und berichtete: «Unsere Ingenieurteams haben herausgefunden, dass Konfigurationsänderungen an den Backbone-Routern, die den Netzwerkverkehr zwischen unseren Rechenzentren koordinieren, zu Problemen führten, die deren Kommunikation unterbrachen».
Die Unterbrechung des Netzwerkverkehrs hatte demnach einen Domino-Effekt auf die Art und Weise, wie die Rechenzentren von Facebook kommunizieren, und brachte die Dienste zum Erliegen. Die Ursache des Ausfalls wirkte sich demnach auch auf viele der internen Tools und Systeme aus, die Facebook-Mitarbeiter in ihrem täglichen Betrieb verwenden. Dies hatte laut dem Konzern eine schnelle Diagnose und Lösung des Problems erschwert.
Facebook geht davon aus, dass die fehlerhafte Konfigurationsänderung die Hauptursache für den Mega-Ausfall war. «Wir haben auch keine Hinweise darauf, dass durch diese Ausfallzeit Benutzerdaten kompromittiert wurden», so der Konzern weiter. Während des Ausfalls sprach Facebook-Technologiechef Mike Schroeper zuerst noch von «Netzwerkproblemen». Internet-Experten tippten währenddessen bereits früh auf einen Konfigurationsfehler in der Netzwerk-Infrastruktur. Vereinfacht gesagt lag das Problem daran, dass die Netze zwar noch da waren, aber die Verknüpfungen fehlten, weil die Wegweiser (Router) falsch eingestellt waren.