Developpez.com - Rubrique Réseau

Le Club des Développeurs et IT Pro

Google : voici ce qui a causé la grande panne de dimanche

D'après le vice-président de l'ingénierie chez Google

Le 2019-06-04 22:56:54, par Jonathan, Chroniqueur Actualités
Dimanche dernier, il est survenu dans certaines régions des Etats-Unis, une perturbation du réseau de Google, qui a entraîné des erreurs et des ralentissements de plusieurs de ses services. Pour la plupart des utilisateurs, cela n'a pas vraiment été perceptible, il est possible qu'ils aient pu constater que les requêtes de recherche étaient un tout petit peu plus lente que d'habitude, mais cela n'a probablement pas duré plus de quelques minutes. Par contre, pour ceux des utilisateurs qui dépendent de services hébergés dans les régions touchées par la panne, l'impact a été bien plus considérable.

Dans un article de blog, Benjamin Treynor Sloss, vice-président de l'ingénierie chez Google, s'est excusé auprès de toutes les personnes ayant été affectées par cette panne et a également fait savoir que la principale cause de la perturbation était un changement de configuration, destiné à un petit nombre de serveurs dans une même région. En temps normal, tout aurait dû se passer sans aucun problème, mais la configuration a été appliquée de manière incorrecte à un plus grand nombre de serveurs dans plusieurs régions voisines, ce qui a obligé ces régions à utiliser plus de la moitié de leur capacité réseau disponible.


La capacité restante du réseau étant insuffisante pour contenir le trafic réseau en provenance et à destination de ces régions, les systèmes de réseau de Google ont donc dû effectuer un tri sur le surplus de trafic en donnant la priorité aux flux de données plus sensibles au temps de latence. L'impact a été sévère pour les plateformes à bande passante élevée telles que YouTube, mais moins pour les services à bande passante réduite tels que Google Search, qui n'a connu qu'une brève augmentation du temps de latence. Le problème en lui-même a été détecté par les équipes d'ingénierie de Google en quelques secondes, mais sa résolution a pris beaucoup plus de temps.

Pendant toute la durée de la panne, plusieurs des services de Google ont été gravement impactés. C'est le cas de YouTube qui, globalement a enregistré une baisse de 2,5 % du nombre de vues en une heure, Google Cloud Storage n'a pas non plus été épargné et a enregistré une réduction de 30 % de son trafic. Pendant que plusieurs trouvent ces explications légères et s'attendent à en avoir des plus détaillées sur les causes profondes de cette panne, Sloss fait savoir que les équipes d'ingénierie de Google continuent de travailler afin de comprendre tous les facteurs qui auraient contribué à la perte de capacité du réseau et à la lenteur de la restauration. Les conclusions de ce travail seront probablement communiquées d'ici peu.

Source : Google

Et vous ?

Qu'en pensez-vous ?
Vous êtes-vous rendus compte de cette pertubation du réseau de Google ?
Pensez-vous qu'il s'agisse simplement d'un problème lié à une configuration incorrecte de serveurs ?

Voir aussi :

Google Drive rencontre un problème majeur de spam la firme rassure et annonce la résolution du problème dans un futur proche
Mozilla revient sur la panne qui a affecté les modules complémentaires de son navigateur Firefox et donne des détails techniques
Google provoque accidentellement une panne massive d'Internet au Japon qui a duré des heures bien que l'erreur ait été corrigée après 8 minutes
  Discussion forum
10 commentaires
  • AoCannaille
    Expert confirmé
    Envoyé par clementmarcotte
    C'est évident non ? On ne peut pas faire confiance à Google.
    Mais quel rapport avec leurs pannes? Ils peuvent avoir une éthique minable tout en fournissant un service fiable et de qualité tu sais? C'est d'ailleurs un peu comme ça qu'ils se sont imposé...
  • Des pannes réseaux, il y en aura toujours

    Il y en aura probablement de moins en moins parce que les très gros réseaux deviennent de plus en plus "auto-adaptatifs" (ça, c'est l'irruption du Machine Learning, de l'IA, du Predictive Analytics, etc). Par contre les pannes réseaux qui demeureront visibles seront de plus en plus violentes parce que de plus grande magnitude avec la "cloudification" des infras.

    Dans le cas présent, c'est la Google Compute Engine Unit qui est partie en vrille après un changement de configuration (le GCEU, c'est le composant essentiel de l'offre IaaS du Cloud Google).

    L'automatisation des changements de configuration, c'est très pratique et ça "scale" comme on dit.
    Par contre, dès qu'il y a des erreurs de configuration, les problèmes se propagent très vite également

    -VX
  • chrtophe
    Responsable Systèmes
    D'un autre coté, tout le réseau ne s'écroule pas. Les services sont dégradés et c'est souvent des problèmes isolés à des secteurs géographiques. Les taux de disponibilité chez Google avoisinent les 99,99%. Ca veut pas dire qu'il n'y en a pas, mais ça reste négligeable. C'est d’ailleurs ce que dit l'article.
  • Mingolito
    Membre extrêmement actif
    Avant ça il y a eu aussi une grosse panne sur AWS et aussi sur Azure. Et aussi des pannes monstrueuses chez OVH, et bien d'autres...
    Bref la sécurité et la tolérance de panne il faut se la faire sois même pas compter sur un seul prestataire.
  • Faut être masochiste pour faire confiance à Google. Ils sont tellement experts en espionnage, (même du courrier privé et des achats en ligne) en pannes soudaines et en erreurs supposément de bonne foi qui violent la sécurité qu'il faudrait les fuir comme de la peste.
  • shadypierre
    Membre actif
    Envoyé par clementmarcotte
    Faut être masochiste pour faire confiance à Google. Ils sont tellement experts en espionnage, (même du courrier privé et des achats en ligne) en pannes soudaines et en erreurs supposément de bonne foi qui violent la sécurité qu'il faudrait les fuir comme de la peste.
    Quel rapport ?
  • Mumus18
    Nouveau membre du Club
    Envoyé par Jonathan

    Source : Google
  • Envoyé par shadypierre
    Quel rapport ?
    C'est évident non ? On ne peut pas faire confiance à Google.
  • matthius
    Inactif
    C'est Gogole quoi !