L’Ecole doctorale : MathĂ©matiques Hadamard
et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux
présentent
l’AVIS DE SOUTENANCE de Madame Katherine Tania MORALES QUINGA
AutorisĂ©e Ă prĂ©senter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă TĂ©lĂ©com SudParis en :
« Modèles de Markov génératifs pour la classification séquentielle bayésienne »
le MERCREDI 2 OCTOBRE 2024 à 10h00 à C06
Telecom SudParis 9 Rue Charles Fourier 91000 Evry-Courcouronnes
Membres du jury :
M. YOHAN PETETIN, MaĂ®tre de confĂ©rences, TĂ©lĂ©com SudParis, FRANCE – Directeur de these
M. ERWAN LE PENNEC, Professeur, Ecole Polytechnique, FRANCE – Examinateur
M. STEPHANE DERRODE, Professeur, École Centrale de Lyon, FRANCE – Examinateur
Mme SYLVIE LE HÉGARAT, Professeure, École normale supĂ©rieure Paris-Saclay, FRANCE – Examinateur
M. FRANCOIS SEPTIER, Professeur, Universite Bretagne Sud, FRANCE – Rapporteur
Mme Myriam MAUMY, Professeure des universitĂ©s, École des hautes Ă©tudes en santĂ© publique (EHESP), FRANCE – Rapporteur
« Modèles de Markov génératifs pour la classification séquentielle bayésienne »
présenté par Madame Katherine Tania MORALES QUINGA
Résumé :
Cette thèse vise Ă modĂ©liser des donnĂ©es sĂ©quentielles Ă travers l’utilisation de modèles probabilistes Ă variables latentes et paramĂ©trĂ©s par des architectures de type rĂ©seaux de neurones profonds. Notre objectif est de dĂ©velopper des modèles dynamiques capables de capturer des dynamiques temporelles complexes inhĂ©rentes aux donnĂ©es sĂ©quentielles tout en Ă©tant applicables dans des domaines variĂ©s tels que la classification, la prĂ©diction et la gĂ©nĂ©ration de donnĂ©es pour n’importe quel type de donnĂ©es sĂ©quentielles. Notre approche se concentre sur plusieurs problĂ©matiques liĂ©s Ă la modĂ©lisation de ce type de donnĂ©es, chacune Ă©tant dĂ©taillĂ© dans un chapitre de ce manuscrit. Dans un premier temps, nous balayons les principes fondamentaux de l’apprentissage profond et de l’estimation bayĂ©sienne. Par la suite, nous nous focalisations sur la modĂ©lisation de donnĂ©es sĂ©quentielles par des modèles de Markov cachĂ©s qui constitueront le socle commun des modèles gĂ©nĂ©ratifs dĂ©veloppĂ©s par la suite. Plus prĂ©cisĂ©ment, notre travail s’intĂ©resse au problème de la classification (bayĂ©sienne) sĂ©quentielle de sĂ©ries temporelles dans diffĂ©rents contextes : supervisĂ© (les donnĂ©es observĂ©es sont Ă©tiquetĂ©es) ; semi-supervisĂ© (les donnĂ©es sont partiellement Ă©tiquetĂ©es) ; et enfin non supervisĂ©s (aucune Ă©tiquette n’est disponible). Pour cela, la combinaison de rĂ©seaux de neurones profonds avec des modèles probabilistes markoviens vise Ă amĂ©liorer le pouvoir gĂ©nĂ©ratif des modĂ©lisations plus classiques mais pose de nombreux dĂ©fis du point de vue de l’infĂ©rence bayĂ©sienne : estimation d’un grand nombre de paramètres, estimation de lois Ă postĂ©riori et interprĂ©tabilitĂ© de certaines variables cachĂ©es (les labels). En plus de proposer une solution pour chacun de ces problèmes, nous nous intĂ©ressons Ă©galement Ă des approches novatrices pour relever des dĂ©fis spĂ©cifiques en imagerie mĂ©dicale posĂ©s par le Groupe EuropĂ©en de Recherche sur les Prothèses AppliquĂ©es Ă la Chirurgie Vasculaire (GEPROMED).
Abstract :
This thesis explores and models sequential data by applying various probabilistic models with latent variables, complemented by deep neural networks. The motivation for this research is the development of dynamic models that adeptly capture the complex temporal dynamics inherent in sequential data. Designed to be versatile and adaptable, these models aim to be applicable across domains including classification, prediction, and data generation, and adaptable to diverse data types. The research focuses on several key areas, each detailed in its respective chapter. Initially, the fundamental principles of deep learning, and Bayesian estimation are introduced. Sequential data modeling is then explored, emphasizing the Markov chain models, which set the stage for the generative models discussed in subsequent chapters. In particular, the research delves into the sequential Bayesian classification of data in supervised, semi-supervised, and unsupervised contexts. The integration of deep neural networks with well-established probabilistic models is a key strategic aspect of this research, leveraging the strengths of both approaches to address complex sequential data problems more effectively. This integration leverages the capabilities of deep neural networks to capture complex nonlinear relationships, significantly improving the applicability and performance of the models. In addition to our contributions, this thesis also proposes novel approaches to address specific challenges posed by the Groupe Européen de Recherche sur les Prothèses Appliquées à la Chirurgie Vasculaire (GEPROMED). These proposed solutions reflect the practical and possible impactful application of this research, demonstrating its potential contribution to the field of vascular surgery.