logo

Supervisor, votre outil de suivi en temps réel des performances et de la disponibilité des services Dstny

mar. 16 avr. 2024 15:42
Trunk SIP
MetaCentrex
OpenSIM Revolution
Direct Touch Routing
Rainbow Touch
Dstny MBCaaS

Impact : Coupure des appels, établissement de nouveaux appels impossible


Cause : En cours d'analyse


Description : Notre infrastructure voix a subi un incident majeur causant la coupure de plus de 90% des appels actifs et rendant l'établissement des nouveaux appels impossibles.


Le système de haute disponibilité a pris le relais.

Notre équipe d'ingénieur analyse les équipement pour déterminer la root-cause et pour stabiliser définitivement l'infrastructure.

Nous constatons que la situation de crise est gérée suite à la reprise du backup, mais des perturbations sont toujours constatées.

Nous faisons le maximum pour stabiliser définitivement le service.

Comme expliqué précédemment, le failover s'est enclenché mais des perturbations se sont toujours fait ressentir par la suite.

Nous avons donc remis en place, à 16h46, une sauvegarde de configuration du 25/03/24, qui a permis de stabiliser l'infrastructure en revoyant la logique d'aboutissement du trafic SIP.

Nos équipes d'ingénieurs continuent de travailler pour identifier la cause de l'incident.

Une nouvelle perturbation majeur a impactée notre infrastructure voix ce matin entre 6h43 et 6h46.


Notre équipe d'ingénieur analyse activement les équipements et les logs systèmes pour déterminer la root-cause afin de la corriger pour stabiliser définitivement l'infrastructure.


Nous reviendrons vers vous dans la journée avec plus d'informations.

Suite aux analyses réalisées ce jour, la cause a pu être identifiée.


Un incident sur un composant interne a généré un failover sur les systèmes de backup, cependant, un crash imprévu des différents nœuds a engendré une saturation au niveau du transit des paquets SIP. Ce transit a lui-même généré une saturation mémoire qui a causé un redémarrage des systèmes.


La root-cause étant identifiée, un plan d’action a été préparé pour une action de maintenance corrective sur le système de l’infrastructure voix concerné par l’incident.

L'intervention aura lieu ce soir :

  • Date : 17/04/2024 - 21h
  • Actions :
  • Augmentation de la mémoire
  • Augmentation du nombre de process enfants pour une meilleure répartition de charge
  • Ajustement de la charge nombre de processeur/processus
  • Impact : Possible coupure des appels en cours

Suite à l'intervention d'hier soir, nous vous confirmons n'avoir rencontré aucun effet de bord lié à cette maintenance.

Sur nos contrôles et monitoring, nous n'avons observé aucune autre défaillance au niveau de notre infrastructure voix.

Le correctif apporté permet de répartir uniformément la charge du trafic SIP sur notre serveur de trunk.

Nos équipes d'ingénieurs continuent de travailler en collaboration avec nos différents éditeurs concernant le service à l'origine du dysfonctionnement, afin de garantir un fonctionnement optimal de l'infrastructure voix.

Dans ce sens, de nouvelles actions de maintenances seront programmées prochainement.

Mentions légales Politique de confidentialité
© 2023 DSTNY. All rights reserved
Chargement