
Le 16 juin dernier, SFR a connu une importante panne qui n’a été résolue qu’à la toute fin de la journée. L’opérateur au carré rouge a livré les secrets derrière cette journée noire au Monde.
L’effet domino
Les problèmes ont commencé à 10 heures comme le raconte Olivier Tailfer, directeur exécutif réseau de l’opérateur, au quotidien. Des opérations pour améliorer le réseau dédié aux entreprises ont été lancées notamment pour installer un correctif de sécurité sur des routeurs.
Une opération réalisée régulièrement par les opérateurs et qui est donc bien connue par ceux-ci mais cette fois, cela ne s’est pas passé comme prévu contrairement aux autres mise à jour faites les jours précédents.
Mais moins d’une heure après le lancement du déploiement, la catastrophe arrive et une centaine de routeurs ne fonctionnent plus, impactant 20 000 clients professionnels sur le fixe au total, y compris les boutiques de l’opérateur et ses revendeurs.
Une solution a été trouvée très rapidement, sur les coups de midi, et tout est rétabli à compter de 15 heures mais la panne initiale a eu des répercussions ailleurs, sue deux points de présence d’importance. Ces sites participent à l’acheminement des données entre l’opérateur et l’internet mais ils sont tombés et SFR peut seulement acheminer 20% du trafic à ce moment là. Vu le goulot d’étranglement important, les télécommunications et le trafic internet tombent.
La situation sera totalement rétablie à 23h, quand les équipes de l’opérateur au carré rouge sont parvenues à remettre le réseau sur pied. La panne aura donc duré une douzaine d’heures et depuis, SFR cherche à savoir à quel niveau l’erreur principale à pu se produire et comment cela s’est répercuté à différents niveaux.