L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris
et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux
présentent
lâAVIS DE SOUTENANCE de Monsieur Ayoub BEN AMEUR
AutorisĂ© Ă prĂ©senter ses travaux en vue de lâobtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă TĂ©lĂ©com SudParis en :
Informatique
« L’Intelligence artificielle pour l’allocation des ressources dans le Multi-tenant Edge Computing »
le JEUDI 30 NOVEMBRE 2023 Ă 14h00
Ă Amphi 2, 19 place Marguerite Perey 91120 Palaiseau
Membres du jury :
M. Tijani CHAHED, Full professor, Telecom SudParis, FRANCE – Directeur de these
M. Anastasios GIOVANIDIS, ChargĂ© de recherche, Ericsson, FRANCE – Rapporteur
M. Antonio CAPONE, Full professor, Politecnico di Milano, ITALIE – Rapporteur
Mme Ana BUSIC, Research Scientist, Ecole Normale SupĂ©rieur – PSL, FRANCE – Examinateur
M. Daniel KOFMAN, Professor, Telecom Paris, FRANCE – Examinateur
M. Andrea ARALDO, Assistant professor, Telecom SudParis , FRANCE – CoDirecteur de these
« L’Intelligence artificielle pour l’allocation des ressources dans le Multi-tenant Edge Computing »
présenté par Monsieur Ayoub BEN AMEUR
Résumé :
Dans cette thĂšse, nous considĂ©rons le Edge Computing (EC) comme un environnement multi-tenant oĂč les OpĂ©rateurs RĂ©seau (NOs) possĂšdent des ressources en pĂ©riphĂ©rie dĂ©ployĂ©es dans les stations de base, les bureaux centraux et/ou les boĂźtiers intelligents, les virtualisent, et permettent aux Fournisseurs de Services tiers (SPs) – ou tenants – de distribuer une partie de leurs applications en pĂ©riphĂ©rie afin de rĂ©pondre aux demandes des utilisateurs. Les SPs aux besoins hĂ©tĂ©rogĂšnes coexistent en pĂ©riphĂ©rie, allant des Communications Ultra-Fiables Ă Latence Ultra-Basse (URLLC) pour le contrĂŽle des vĂ©hicules ou des robots, Ă la Communication de Type Machine Massive (mMTC) pour l’Internet des Objets (IoT) nĂ©cessitant un grand nombre de dispositifs connectĂ©s, en passant par les services multimĂ©dias tels que la diffusion vidĂ©o et la RĂ©alitĂ© AugmentĂ©e/Virtuelle (AR/VR), dont la qualitĂ© d’expĂ©rience dĂ©pend fortement des ressources disponibles. Les SPs orchestrent indĂ©pendamment leur ensemble de microservices, exĂ©cutĂ©s dans des conteneurs, qui peuvent ĂȘtre facilement rĂ©pliquĂ©s, migrĂ©s ou arrĂȘtĂ©s. Chaque SP peut s’adapter aux ressources allouĂ©es par le NO, en dĂ©cidant s’il doit exĂ©cuter des microservices sur les appareils, les nĆuds en pĂ©riphĂ©rie ou dans le cloud. L’objectif de cette thĂšse est de promouvoir l’Ă©mergence de dĂ©ploiements rĂ©els du « vĂ©ritable » EC dans de vrais rĂ©seaux, en montrant l’utilitĂ© que les NOs peuvent tirer de l’EC. Nous croyons que cela peut contribuer Ă encourager l’engagement concret et les investissements des NOs dans l’EC. Ă cette fin, nous proposons de concevoir de nouvelles stratĂ©gies basĂ©es sur les donnĂ©es qui allouent efficacement les ressources entre les SPs hĂ©tĂ©rogĂšnes, en pĂ©riphĂ©rie, appartenant au NO, afin d’optimiser ses objectifs pertinents, tels que la rĂ©duction des coĂ»ts, la maximisation des revenus et l’amĂ©lioration de la QualitĂ© de Service (QoS) perçue par les utilisateurs finaux, en termes de latence, de fiabilitĂ© et de dĂ©bit, tout en rĂ©pondant aux exigences des SPs. Cette thĂšse prĂ©sente une perspective sur la maniĂšre dont les NOs, les seuls propriĂ©taires de ressources en pĂ©riphĂ©rie, peuvent extraire de la valeur grĂące Ă la mise en Ćuvre de l’EC dans un environnement multi-tenant. En promouvant cette vision de l’EC et en la soutenant par des rĂ©sultats quantitatifs et une analyse approfondie, cette thĂšse fournit principalement aux NOs des conclusions susceptibles d’influencer les stratĂ©gies de dĂ©cision concernant le dĂ©ploiement futur de l’EC. Cela pourrait favoriser l’Ă©mergence de nouvelles applications Ă faible latence et Ă forte intensitĂ© de donnĂ©es, telles que la rĂ©alitĂ© augmentĂ©e haute rĂ©solution, qui ne sont pas envisageables dans le cadre actuel du Cloud Computing (CC). Une autre contribution de la thĂšse est qu’elle propose des solutions basĂ©es sur des mĂ©thodes novatrices exploitant la puissance de l’optimisation basĂ©e sur les donnĂ©es. En effet, nous adaptons des techniques de pointe issues de l’Apprentissage par Renforcement (RL) et de la prise de dĂ©cision sĂ©quentielle au problĂšme pratique de l’allocation des ressources en EC. Ce faisant, nous parvenons Ă rĂ©duire le temps d’apprentissage des stratĂ©gies adoptĂ©es Ă des Ă©chelles compatibles avec la dynamique de l’EC, grĂące Ă la conception soignĂ©e de modĂšles d’estimation intĂ©grĂ©s au processus d’apprentissage. Nos stratĂ©gies sont conçues de maniĂšre Ă ne pas violer les garanties de confidentialitĂ© essentielles pour que les SPs acceptent d’exĂ©cuter leurs calculs en pĂ©riphĂ©rie, grĂące Ă l’environnement multi-tenant.
Abstract :
We consider in this thesis Edge Computing (EC) as a multi-tenant environment where Network Operators (NOs) own edge resources deployed in base stations, central offices and/or smart boxes, virtualize them and let third party Service Providers (SPs) – or tenants – distribute part of their applications in the edge in order to serve the requests sent by the users. SPs with heterogeneous requirements coexist in the edge, ranging from Ultra-Reliable Low Latency Communications (URLLC) for controlling cars or robots, to massive Machine Type Communication (mMTC) for Internet of Things (IoT) requiring a massive number of connected devices, to media services, such as video streaming and Augmented/Virtual Reality (AR/VR), whose quality of experience is strongly dependant on the available resources. SPs independently orchestrate their set of microservices, running on containers, which can be easily replicated, migrated or stopped. Each SP can adapt to the resources allocated by the NO, deciding whether to run microservices in the devices, in the edge nodes or in the cloud. We aim in this thesis to advance the emergence of real deployments of the âtrueâ EC in real networks, by showing the utility that NOs can collect thanks to EC. We believe that this can contribute to encourage concrete engagement and investments engagement of NOs in EC. For this, we point to design novel data-driven strategies that efficiently allocate resources between heterogeneous SPs, at the edge owned by the NO, in order to optimize its relevant objectives, e.g., cost reduction, revenue maximization and better Quality of Service (QoS) perceived by end users, in terms of latency, reliability and throughput, while satisfying the SPs requirements. This thesis presents a perspective on how NOs, the sole owners of resources at the far edge (e.g., at base stations), can extract value through the implementation of EC within a multi-tenant environment. By promoting this vision of EC and by supporting it via quantitative results and analysis, this thesis provides, mainly to NOs, findings that can influence decision strategies about the future deployment of EC. This might foster the emergence of novel low-latency and data-intensive applications, such as high resolution augmented reality, which are not feasible in the current Cloud Computing (CC) setting. Another contribution of the thesis it that it provides solutions based on novel methods that harness the power of data-driven optimization.We indeed adapt cutting-edge techniques from Reinforcement Learning (RL) and sequential decision making to the practical problem of resource allocation in EC. In doing so, we succeed in reducing the learning time of the adopted strategies up to scales that are compatible with the EC dynamics, via careful design of estimation models embedded in the learning process. Our strategies are conceived in order not to violate the confidentiality guarantees that are essential for SPs to accept running their computation at the EC, thanks to the multi-tenant setting.