AVIS DE SOUTENANCE de Monsieur Ayoub BEN AMEUR

L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris

et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux

présentent

l’AVIS DE SOUTENANCE de Monsieur Ayoub BEN AMEUR

AutorisĂ© Ă  prĂ©senter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă  TĂ©lĂ©com SudParis en :

Informatique

« L’Intelligence artificielle pour l’allocation des ressources dans le Multi-tenant Edge Computing »

le JEUDI 30 NOVEMBRE 2023 Ă  14h00

Ă  Amphi 2, 19 place Marguerite Perey 91120 Palaiseau

Membres du jury :

M. Tijani CHAHED, Full professor, Telecom SudParis, FRANCE – Directeur de these
M. Anastasios GIOVANIDIS, ChargĂ© de recherche, Ericsson, FRANCE – Rapporteur
M. Antonio CAPONE, Full professor, Politecnico di Milano, ITALIE – Rapporteur
Mme Ana BUSIC, Research Scientist, Ecole Normale SupĂ©rieur – PSL, FRANCE – Examinateur
M. Daniel KOFMAN, Professor, Telecom Paris, FRANCE – Examinateur
M. Andrea ARALDO, Assistant professor, Telecom SudParis , FRANCE – CoDirecteur de these

« L’Intelligence artificielle pour l’allocation des ressources dans le Multi-tenant Edge Computing »

présenté par Monsieur Ayoub BEN AMEUR

Résumé :

Dans cette thèse, nous considĂ©rons le Edge Computing (EC) comme un environnement multi-tenant oĂą les OpĂ©rateurs RĂ©seau (NOs) possèdent des ressources en pĂ©riphĂ©rie dĂ©ployĂ©es dans les stations de base, les bureaux centraux et/ou les boĂ®tiers intelligents, les virtualisent, et permettent aux Fournisseurs de Services tiers (SPs) – ou tenants – de distribuer une partie de leurs applications en pĂ©riphĂ©rie afin de rĂ©pondre aux demandes des utilisateurs. Les SPs aux besoins hĂ©tĂ©rogènes coexistent en pĂ©riphĂ©rie, allant des Communications Ultra-Fiables Ă  Latence Ultra-Basse (URLLC) pour le contrĂ´le des vĂ©hicules ou des robots, Ă  la Communication de Type Machine Massive (mMTC) pour l’Internet des Objets (IoT) nĂ©cessitant un grand nombre de dispositifs connectĂ©s, en passant par les services multimĂ©dias tels que la diffusion vidĂ©o et la RĂ©alitĂ© AugmentĂ©e/Virtuelle (AR/VR), dont la qualitĂ© d’expĂ©rience dĂ©pend fortement des ressources disponibles. Les SPs orchestrent indĂ©pendamment leur ensemble de microservices, exĂ©cutĂ©s dans des conteneurs, qui peuvent ĂŞtre facilement rĂ©pliquĂ©s, migrĂ©s ou arrĂŞtĂ©s. Chaque SP peut s’adapter aux ressources allouĂ©es par le NO, en dĂ©cidant s’il doit exĂ©cuter des microservices sur les appareils, les nĹ“uds en pĂ©riphĂ©rie ou dans le cloud. L’objectif de cette thèse est de promouvoir l’Ă©mergence de dĂ©ploiements rĂ©els du « vĂ©ritable » EC dans de vrais rĂ©seaux, en montrant l’utilitĂ© que les NOs peuvent tirer de l’EC. Nous croyons que cela peut contribuer Ă  encourager l’engagement concret et les investissements des NOs dans l’EC. Ă€ cette fin, nous proposons de concevoir de nouvelles stratĂ©gies basĂ©es sur les donnĂ©es qui allouent efficacement les ressources entre les SPs hĂ©tĂ©rogènes, en pĂ©riphĂ©rie, appartenant au NO, afin d’optimiser ses objectifs pertinents, tels que la rĂ©duction des coĂ»ts, la maximisation des revenus et l’amĂ©lioration de la QualitĂ© de Service (QoS) perçue par les utilisateurs finaux, en termes de latence, de fiabilitĂ© et de dĂ©bit, tout en rĂ©pondant aux exigences des SPs. Cette thèse prĂ©sente une perspective sur la manière dont les NOs, les seuls propriĂ©taires de ressources en pĂ©riphĂ©rie, peuvent extraire de la valeur grâce Ă  la mise en Ĺ“uvre de l’EC dans un environnement multi-tenant. En promouvant cette vision de l’EC et en la soutenant par des rĂ©sultats quantitatifs et une analyse approfondie, cette thèse fournit principalement aux NOs des conclusions susceptibles d’influencer les stratĂ©gies de dĂ©cision concernant le dĂ©ploiement futur de l’EC. Cela pourrait favoriser l’Ă©mergence de nouvelles applications Ă  faible latence et Ă  forte intensitĂ© de donnĂ©es, telles que la rĂ©alitĂ© augmentĂ©e haute rĂ©solution, qui ne sont pas envisageables dans le cadre actuel du Cloud Computing (CC). Une autre contribution de la thèse est qu’elle propose des solutions basĂ©es sur des mĂ©thodes novatrices exploitant la puissance de l’optimisation basĂ©e sur les donnĂ©es. En effet, nous adaptons des techniques de pointe issues de l’Apprentissage par Renforcement (RL) et de la prise de dĂ©cision sĂ©quentielle au problème pratique de l’allocation des ressources en EC. Ce faisant, nous parvenons Ă  rĂ©duire le temps d’apprentissage des stratĂ©gies adoptĂ©es Ă  des Ă©chelles compatibles avec la dynamique de l’EC, grâce Ă  la conception soignĂ©e de modèles d’estimation intĂ©grĂ©s au processus d’apprentissage. Nos stratĂ©gies sont conçues de manière Ă  ne pas violer les garanties de confidentialitĂ© essentielles pour que les SPs acceptent d’exĂ©cuter leurs calculs en pĂ©riphĂ©rie, grâce Ă  l’environnement multi-tenant.


Abstract :

We consider in this thesis Edge Computing (EC) as a multi-tenant environment where Network Operators (NOs) own edge resources deployed in base stations, central offices and/or smart boxes, virtualize them and let third party Service Providers (SPs) – or tenants – distribute part of their applications in the edge in order to serve the requests sent by the users. SPs with heterogeneous requirements coexist in the edge, ranging from Ultra-Reliable Low Latency Communications (URLLC) for controlling cars or robots, to massive Machine Type Communication (mMTC) for Internet of Things (IoT) requiring a massive number of connected devices, to media services, such as video streaming and Augmented/Virtual Reality (AR/VR), whose quality of experience is strongly dependant on the available resources. SPs independently orchestrate their set of microservices, running on containers, which can be easily replicated, migrated or stopped. Each SP can adapt to the resources allocated by the NO, deciding whether to run microservices in the devices, in the edge nodes or in the cloud. We aim in this thesis to advance the emergence of real deployments of the “true” EC in real networks, by showing the utility that NOs can collect thanks to EC. We believe that this can contribute to encourage concrete engagement and investments engagement of NOs in EC. For this, we point to design novel data-driven strategies that efficiently allocate resources between heterogeneous SPs, at the edge owned by the NO, in order to optimize its relevant objectives, e.g., cost reduction, revenue maximization and better Quality of Service (QoS) perceived by end users, in terms of latency, reliability and throughput, while satisfying the SPs requirements. This thesis presents a perspective on how NOs, the sole owners of resources at the far edge (e.g., at base stations), can extract value through the implementation of EC within a multi-tenant environment. By promoting this vision of EC and by supporting it via quantitative results and analysis, this thesis provides, mainly to NOs, findings that can influence decision strategies about the future deployment of EC. This might foster the emergence of novel low-latency and data-intensive applications, such as high resolution augmented reality, which are not feasible in the current Cloud Computing (CC) setting. Another contribution of the thesis it that it provides solutions based on novel methods that harness the power of data-driven optimization.We indeed adapt cutting-edge techniques from Reinforcement Learning (RL) and sequential decision making to the practical problem of resource allocation in EC. In doing so, we succeed in reducing the learning time of the adopted strategies up to scales that are compatible with the EC dynamics, via careful design of estimation models embedded in the learning process. Our strategies are conceived in order not to violate the confidentiality guarantees that are essential for SPs to accept running their computation at the EC, thanks to the multi-tenant setting.