• Accueil
  • Accueil
  • Accueil
  • Accueil

CNRS

Rechercher




Accueil >

Soutenance de thèse de Monsieur Achille SALAÜN, "Prédiction d’alarmes dans les réseaux via la recherche de motifs spatio-temporels et l’apprentissage automatique"

L’Ecole doctorale : Mathématiques Hadamard et le Laboratoire de recherche SAMOVAR présentent l’AVIS DE SOUTENANCE de Monsieur Achille SALAÜN

Autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, préparé à Télécom SudParis en :
« Prédiction d’alarmes dans les réseaux via la recherche de motifs spatio-temporels et l’apprentissage automatique »

le JEUDI 8 JUILLET 2021 à 14h00
à Paris-Rennes-Nice (EIT Digital)
LINCS 23, avenue d’Italie 75013 Paris

Membres du jury :

M. François DESBOUVRIES, Professeur,
Télécom SudParis, FRANCE
Directeur de thèse
M. Maurizio FILIPPONE, Associate Professor,
EURECOM, FRANCE
Rapporteur
M. Matthieu LATAPY, Directeur de recherche,
CNRS (LIP6), FRANCE
Rapporteur
Mme Anne BOUILLARD, Ingénieure de recherche,
Huawei Technologies France, FRANCE
CoDirectrice de thèse
Mme Johanne COHEN, Directrice de recherche,
CNRS (LISN), FRANCE
Examinatrice
M. Erwan LE PENNEC, Professeur,
Ecole Polytechnique (CMAP), FRANCE
Examinateur

Résumé :

Les réseaux de télécommunication prennent aujourd’hui une place prépondérante dans notre monde. Ils permettent en effet de partager des informations en masse et à l’échelle planétaire. Toutefois, il s’agit de systèmes complexes, en taille comme en diversité technologique. Cela rend d’autant plus complexes leur maintenance et leur réparation. Afin de limiter l’influence négative de ces dernières, des outils doivent être développés pour détecter une panne dès qu’elle a lieu, en analyser les causes afin de la résoudre efficacement, voire prédire ladite panne pour prévenir plutôt que guérir. Dans cette thèse, nous nous intéressons principalement à ces deux derniers problèmes. Pour cela, nous disposons de fichiers, appelés logs d’alarmes, recensant l’ensemble des alarmes émises par le système. Cependant, ces fichiers sont généralement verbeux et bruités : l’administrateur à la charge d’un réseau doit disposer d’outils capables d’isoler et manipuler de façon interprétable les liens de causalité au sein d’un log. Dans cette thèse, nous avons suivi deux approches. La première est inspirée des techniques de correspondance de motifs : en s’inspirant de l’algorithme d’Ukkonen, nous construisons en ligne une structure, appelée DIG-DAG, qui stocke toutes les chaînes de causalité possibles entre les événements d’un log. Nous proposons également un système de requête pour exploiter cette structure. Enfin, nous appliquons cette approche dans le cadre de l’analyse de causes racines. La seconde approche est une approche générative pour la prédiction de données. En particulier, nous comparons deux modèles classiques pour cette tâche : les réseaux de neurones récurrents d’une part et les modèles de Markov cachés d’autre part. En effet, dans leurs communautés respectives, ces deux modèles font office d’état de l’art. Ici, nous comparons analytiquement leurs expressivités grâce à un modèle probabiliste, appelé GUM, englobant ces deux modèles.

Abstract :

Nowadays, telecommunication networks occupy a central position in our world. Indeed, they allow to share worldwide a huge amount of information. Networks are however complex systems, both in size and technological diversity. Therefore, it makes their management and reparation more difficult. In order to limit the negative impact of such failures, some tools have to be developed to detect a failure whenever it occurs, analyse its root causes to solve it efficiently, or even predict this failure as prevention is better than cure. In this thesis, we mainly focus on these two last problems. To do so, we use files, called alarm logs, storing all the alarms that have been emitted by the system. However, these files are generally noisy and verbose : an operator managing a network needs tools able to extract and handle in an interpretable manner the causal relationships inside a log. In this thesis, we followed two directions. First, we have inspired from pattern matching techniques : similarly to the Ukkonen’s algorithm, we build online a structure, called DIG-DAG, that stores all the potential causal relationships between the events of a log. Moreover, we introduce a query system to exploit our DIG-DAG structure. Finally, we show how our solution can be used for root cause analysis. The second approach is a generative approach for the prediction of time series. In particular, we compare two well-known models for this task : recurrent neural nets on the one hand, hidden Markov models on the other hand. Here, we compare analytically the expressivity of these models by encompassing them into a probabilistic model, called GUM.