• Accueil
  • Accueil
  • Accueil
  • Accueil

CNRS

Rechercher




Accueil > Productions scientifiques > Thèses SAMOVAR > Thèses 2021

Soutenance de thèse de Monsieur Mustafizur Rahman SHAHID, "Deep Learning for Internet of Things (IoT) Network Security"

Ecole Doctorale de l’Institut Polytechnique de Paris et le Laboratoire de recherche SAMOVAR présentent
l’AVIS DE SOUTENANCE de Monsieur Mustafizur Rahman SHAHID
Autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, préparé à Télécom SudParis en :
Informatique
« Deep Learning for Internet of Things (IoT) Network Security »
le lundi 22 mars 2021 à 10h00

SOUTENANCE EN VISIO - Covid-19.

Membres du jury :

M. Hervé DEBAR, Professeur,
Télécom SudParis - Institut Polytechnique de Paris, FRANCE
Directeur de thèse
M. Gregory BLANC, Maître de conférences,
Télécom SudParis - Institut Polytechnique de Paris, FRANCE
Co-encadrant de thèse
M. Sébastien TIXEUIL, Professeur,
Sorbonne Université, FRANCE
Rapporteur
M. Eric TOTEL, Professeur,
IMT Atlantique, FRANCE
Rapporteur
M. Youki KADOBAYASHI, Professeur,
Nara Institute of Science and Technology, JAPON
Examinateur
M. Thomas CLAUSEN, Professeur,
École Polytechnique, FRANCE
Examinateur
Mme Cristel PELSSER, Professeure,
Université de Strasbourg, FRANCE
Examinatrice
M. Urko ZURUTUZA, Maître de conférences,
Mondragon University, ESPAGNE
Examinateur

Résumé :

L’internet des objets (IoT) introduit de nouveaux défis pour la sécurité des réseaux. La plupart des objets IoT sont vulnérables en raison d’un manque de sensibilisation à la sécurité des fabricants d’appareils et des utilisateurs. En conséquence, ces objets sont devenus des cibles privilégiées pour les développeurs de malware qui veulent les transformer en bots. Contrairement à un ordinateur de bureau, un objet IoT est conçu pour accomplir des tâches spécifiques. Son comportement réseau est donc très stable et prévisible, ce qui le rend bien adapté aux techniques d’analyse de données. Ainsi, la première partie de cette thèse tire profit des algorithmes de deep learning pour développer des outils de surveillance des réseaux IoT. Deux types d’outils sont explorés : Les systèmes de reconnaissance de type d’objets IoT et les systèmes de détection d’intrusion réseau IoT. Pour la reconnaissance des types d’objets IoT, des algorithmes d’apprentissage supervisé sont entrainés pour classifier le trafic réseau et déterminer à quel objet IoT le trafic appartient. Le système de détection d’intrusion consiste en un ensemble d’autoencoders, chacun étant entrainer pour un type d’objet IoT différent. Les autoencoders apprennent le profil du comportement réseau légitime et détectent tout écart par rapport à celui-ci. Les résultats expérimentaux en utilisant des données réseau produites par une maison connectée montrent que les modèles proposés atteignent des performances élevées. Malgré des résultats préliminaires prometteurs, l’entraînement et l’évaluation des modèles basés sur le machine learning nécessitent une quantité importante de données réseau IoT. Or, très peu de jeux de données de trafic réseau IoT sont accessibles au public. Le déploiement physique de milliers d’objets IoT réels peut être très coûteux et peut poser problème quant au respect de la vie privée. Ainsi, dans la deuxième partie de cette thèse, nous proposons d’exploiter des GAN (Generative Adversarial Networks) pour générer des flux bidirectionnels qui ressemblent à ceux produits par un véritable objet IoT. Un flux bidirectionnel est représenté par la séquence des tailles de paquets ainsi que de la durée du flux. Par conséquent, en plus de générer des caractéristiques au niveau des paquets, tel que la taille de chaque paquet, notre générateur apprend implicitement à se conformer aux caractéristiques au niveau du flux, comme le nombre total de paquets et d’octets dans un flux ou sa durée totale. Des résultats expérimentaux utilisant des données produites par un haut-parleur intelligent montrent que notre méthode permet de générer des flux bidirectionnels synthétiques réalistes et de haute qualité.

Abstract  :

The growing Internet of Things (IoT) introduces new security challenges for network activity monitoring. Most IoT devices are vulnerable because of a lack of security awareness from device manufacturers and end users. As a consequence, they have become prime targets for malware developers who want to turn them into bots. Contrary to general-purpose devices, an IoT device is designed to perform very specific tasks. Hence, its networking behavior is very stable and predictable making it well suited for data analysis techniques. Therefore, the first part of this thesis focuses on leveraging recent advances in the field of deep learning to develop network monitoring tools for the IoT. Two types of network monitoring tools are explored : IoT device type recognition systems and IoT network Intrusion Detection Systems (NIDS). For IoT device type recognition, supervised machine learning algorithms are trained to perform network traffic classification and determine what IoT device the traffic belongs to. The IoT NIDS consists of a set of autoencoders, each trained for a different IoT device type. The autoencoders learn the legitimate networking behavior profile and detect any deviation from it. Experiments using network traffic data produced by a smart home show that the proposed models achieve high performance. Despite yielding promising results, training and testing machine learning based network monitoring systems requires tremendous amount of IoT network traffic data. But, very few IoT network traffic datasets are publicly available. Physically operating thousands of real IoT devices can be very costly and can rise privacy concerns. In the second part of this thesis, we propose to leverage Generative Adversarial Networks (GAN) to generate bidirectional flows that look like they were produced by a real IoT device. A bidirectional flow consists of the sequence of the sizes of individual packets along with a duration. Hence, in addition to generating packet-level features which are the sizes of individual packets, our developed generator implicitly learns to comply with flow-level characteristics, such as the total number of packets and bytes in a bidirectional flow or the total duration of the flow. Experimental results using data produced by a smart speaker show that our method allows us to generate high quality and realistic looking synthetic bidirectional flows.