L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris
et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux
présentent
l’AVIS DE SOUTENANCE de Madame Sara CHENNOUFI
AutorisĂ©e Ă prĂ©senter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă TĂ©lĂ©com SudParis en :
Informatique
« Partage de connaissances sur les attaques de manière robuste et prĂ©servant la confidentialitĂ© dans des rĂ©seaux 5G hĂ©tĂ©rogènes grâce Ă une dĂ©tection d’intrusion basĂ©e sur l’apprentissage fĂ©dĂ©rĂ© par prototype »
le MARDI 16 DéCEMBRE 2025 à 9h30
Ă
Salle 1C27
19 Place Marguerite Perey, 91120 Palaiseau
Membres du jury :
M. HervĂ© DEBAR, Professeur, TĂ©lĂ©com SudParis, FRANCE – Directeur de thèse
M. Gilles GUETTE, Professeur, IMT Atlantique (IRISA), FRANCE – Rapporteur
M. Philippe OWEZARSKI, Directeur de recherche, CNRS (LAAS), FRANCE – Examinateur
M. Abdelkader LAHMADI, Professeur, UniversitĂ© de Lorraine (LORIA), FRANCE – Rapporteur
Mme Nga NGUYEN, MaĂ®tresse de confĂ©rences, ESILV (DVRC), FRANCE – Examinateur
M. Christophe KIENNERT, MaĂ®tre de confĂ©rences, TĂ©lĂ©com SudParis, FRANCE – Co-encadrant de thèse
Invités :
M. Gregory BLANC, MaĂ®tre de confĂ©rences, TĂ©lĂ©com SudParis, FRANCE – Co-encadrant de thèse
M. Yufei HAN, Chargé de recherche, Inria, FRANCE
« Partage de connaissances sur les attaques de manière robuste et prĂ©servant la confidentialitĂ© dans des rĂ©seaux 5G hĂ©tĂ©rogènes grâce Ă une dĂ©tection d’intrusion basĂ©e sur l’apprentissage fĂ©dĂ©rĂ© par prototype »
présenté par Madame Sara CHENNOUFI
Résumé :
Les réseaux de cinquième génération (5G) représentent une avancée importante dans les communications mobiles, offrant des performances améliorées (par exemple des débits plus élevés et une latence ultra-faible) et permettant à des services variés, allant des applications médicales en temps réel aux réseaux IoT, de coexister sur une même infrastructure grâce à des technologies telles que le slicing et la virtualisation.Cette flexibilité s’accompagne de défis importants pour les systèmes de détection d’intrusion (IDS), notamment l’hétérogénéité des données, les volumes massifs de trafic, les contraintes de confidentialité, ainsi que l’émergence de nouveaux vecteurs d’attaque susceptibles d’apparaître d’abord dans certains domaines avant de se propager ailleurs. La collaboration entre participants du réseau est essentielle pour construire des modèles de détection disposant d’une connaissance plus large des attaques, mais les contraintes réglementaires et les exigences de confidentialité empêchent le partage direct de données sensibles. L’apprentissage fédéré(AF), qui échange des mises à jour de modèles plutôt que des données brutes, constitue donc un candidat naturel. Cependant, les approches standard telles que FedAvg fonctionnent mal face à l’hétérogénéité marquée des données dans les environnements 5G, où les classes d’attaque sont distribuées de manière inégale entre les participants, et où un nombre significatif de clients ne rencontre que très peu ou pas du tout certains types d’attaques. Cette thèse aborde ces limitations en trois étapes. Premièrement, elle propose une analyse détaillée des IDS et des IDS utilisant l’AF dans le contexte 5G, en identifiant comment les propriétés spécifiques de la 5G se traduisent en exigences de conception et en mettant en évidence les limites des solutions actuelles en matière d’hétérogénéité, de confidentialité et de robustesse. Deuxièmement, elle introduit PROTEAN, un cadre fédéré de détection d’intrusion qui agrège conjointement les paramètres du modèle et des prototypes spécifiques aux classes (des moyennes d’embeddings résumant les comportements d’attaque) via un mécanisme de double agrégation alignant les prototypes et le classifieur global entre participants, ce qui permet la reconnaissance de menaces rares ou jamais observées, sans partager le trafic. Troisièmement, elle évalue la confidentialité et la robustesse de ce cadre en menant des attaques de reconstruction exploitant les prototypes partagés, en renforçant PROTEAN par de la confidentialité différentielle, et en exploitant les informations par classe pour concevoir notre algorithme LabelDec pour la détection des attaques par empoisonnement . Cette méthode est fondée sur les prototypes permettant de détecter les attaques de changement de label et les erreurs de labellisation au niveau des clients et des classes, surpassant les méthodes existantes reposant uniquement sur les paramètres ou performances du modèle. Les évaluations menées sur deux ensembles de données, X-IIoTID et 5G-NIDD, dans des conditions d’hétérogénéité élevées, montrent que PROTEAN améliore les performances de détection et accélère la convergence par rapport aux autres méthodes AF de référence, tout en préservant la confidentialité et maintenant une robustesse effective face aux attaques par empoisonnement. Dans l’ensemble, ces contributions font progresser la détection d’intrusion collaborative pour les réseaux 5G en démontrant que le partage de connaissances fondé sur les prototypes peut simultanément traiter les défis liés à l’hétérogénéité et à la robustesse dans des contextes multipartites, tout en améliorant la compréhension des attaques absentes des données locales et en respectant la confidentialité. Nous espérons que ces résultats encourageront de futurs travaux sur l’apprentissage par prototypes comme base pour un partage de connaissances sur les menaces de manière préservant la confidentialité, robuste et interprétable dans les systèmes distribués.
Abstract :
Fifth-generation (5G) networks represent a transformative advancement in mobile communications, offering enhanced performance (e.g., higher data rates, ultra-low latency) and enabling diverse services, from real-time medical applications to IoT networks, to coexist on a single infrastructure through technologies such as network slicing and virtualization. This flexibility comes with major challenges for Intrusion Detection Systems (IDSs), including data heterogeneity, massive data volumes, privacy constraints, and the emergence of new attack vectors that may first appear in some domains before propagating to others. Collaboration among network participants is essential to building comprehensive detection models with broad attack knowledge, but privacy concerns and regulatory constraints prevent the sharing of sensitive traffic data. Federated Learning (FL), which exchanges model updates instead of raw data, is a natural candidate. Yet, standard FL approaches such as FedAvg perform poorly under the extreme data heterogeneity in this context, where attack classes are not equally distributed, and many clients either rarely observe certain attacks or never encounter them at all. This thesis tackles these limitations in three steps. First, it offers a detailed analysis of IDSs and FL-based IDSs proposed for 5G, identifying how 5G-specific properties translate into design requirements, and where current solutions fall short in terms of heterogeneity handling and robustness. Second, it introduces PROTEAN, a federated intrusion detection framework that jointly aggregates model parameters and class-specific prototypes (average of embeddings by class summarizing the attack behaviour) through a dual aggregation mechanism that aligns the prototypes and global classifier across participants, enabling the recognition of rare and previously unseen threats without sharing raw traffic. Third, it audits the privacy and robustness of this framework by mounting reconstruction attacks using shared prototypes, reinforcing PROTEAN with differential privacy, and exploiting its class-level information to design LabelDec, our poisoning detection algorithm. This novel prototype-based method detects label-flipping poisoning and mislabeling errors at the client and class level and outperforms existing methods relying solely on model parameters or performance. Evaluations on two datasets, X-IIoTID and 5G-NIDD, under severe heterogeneity show that PROTEAN improves detection performance and convergence behaviour over state-of-the-art FL baselines while preserving privacy and showing robustness against poisoning attacks. Together, these contributions advance collaborative intrusion detection for 5G networks by demonstrating that prototype-based knowledge sharing can simultaneously address heterogeneity and robustness in multi-party settings while enhancing unseen attack understanding and respecting privacy. We expect that these results will encourage further work on prototype learning as a foundation for privacy-preserving, robust, and interpretable threat-knowledge sharing in distributed systems.
