High Tech

Facebook, WhatsApp et Instagram ont tous été déconnectés en raison de la maintenance

Les panne massive qui a supprimé Facebook, ses services associés (Instagram, WhatsApp, Oculus, Messenger), sa plate-forme pour les entreprises et le propre réseau interne de l’entreprise ont tous commencé par une maintenance de routine.

Selon vice-président des infrastructures Santosh Janardhan, une commande émise lors de la maintenance a provoqué par inadvertance un arrêt du backbone qui relie tous les centres de données de Facebook, partout dans le monde.

Cela en soi est déjà assez mauvais, mais comme nous l’avons déjà expliqué, la raison pour laquelle vous ne pouviez pas utiliser Facebook est que les informations de routage DNS et BGP pointant vers ses serveurs ont soudainement disparu. Selon Janardhan, ce problème était un problème secondaire, car les serveurs DNS de Facebook ont ​​noté la perte de connexion à la dorsale et ont cessé de publier les informations de routage BGP qui aident chaque ordinateur sur Internet à trouver ses serveurs. Les serveurs DNS fonctionnaient toujours, mais ils étaient inaccessibles.

Le manque de connexions réseau et la perte de DNS ont coupé les serveurs des ingénieurs essayant de résoudre le problème et ont désactivé de nombreux outils qu’ils utilisent normalement pour la réparation et la communication — comme nous l’avons entendu hier.

Le billet de blog note que les ingénieurs ont rencontré des obstacles supplémentaires en raison de la sécurité physique et système autour de ce matériel crucial. Une fois qu’ils ont « activé les protocoles d’accès sécurisé » (ce n’est apparemment pas un mot de code pour « ouvrir la porte du serveur avec une meuleuse d’angle), ils ont pu mettre l’épine dorsale en ligne et restaurer lentement les services en augmentant progressivement les charges. C’est en partie la raison pour laquelle il a fallu plus de temps à certaines personnes pour récupérer l’accès hier, car les exigences en matière de puissance et de calcul pour tout allumer en même temps auraient pu causer plus de plantages.

Alors c’est tout. Pas de théories du complot, et pas de techniciens prenant des haches pour sécuriser les installations pour rallumer le bébé de Mark Zuckerberg. Juste un bug dans une commande qu’un outil d’audit a raté, et pendant six heures, les services qui connectent des milliards de personnes ont disparu.




Source link

Articles similaires

Bouton retour en haut de la page