L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris
et le Laboratoire de recherche SAMOVAR – Services répartis, Architectures, Modélisation, Validation, Administration des Réseaux
présentent
l’AVIS DE SOUTENANCE de Monsieur Zhaobo HU
Autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, préparé à l’Institut Polytechnique de Paris Télécom SudParis en :
Informatique
« Apprentissage profond spatiotemporel : de la découverte de motifs à la prévision robuste »
le MARDI 26 MAI 2026 à 14h00
à
Amphithéâtre 2
Telecom SudParis 19 place Marguerite Perey 91120 Palaiseau
Membres du jury :
M. Hossam AFIFI, Full professor, Institut Polytechnique de Paris Télécom SudParis, FRANCE – Directeur de these
M. Ken CHEN, Full professor, Université Sorbonne Paris Nord, FRANCE – Rapporteur
M. Nadjib ACHIR, Associate Professor, INRIA Saclay, FRANCE – Rapporteur
M. Anastasios GIOVANIDIS, Chargé de recherche, Ericsson MASSY, FRANCE – Examinateur
M. Vincent GAUTHIER, Associate Professor, Institut Polytechnique de Paris Télécom SudParis, FRANCE – Co-encadrant de these
M. Hassine MOUNGLA, Full professor, Université Paris Cité, FRANCE – Examinateur
« Apprentissage profond spatiotemporel : de la découverte de motifs à la prévision robuste »
présenté par Monsieur Zhaobo HU
Résumé :
La prolifération des capteurs géolocalisés et données mobiles rend l’apprentissage profond spatiotemporel central pour comprendre les dynamiques en réseau. Toutefois, extraire des informations exploitables exige de surmonter des défis en découverte de motifs, modélisation structurelle et robustesse statistique. Cette thèse présente un cadre cohérent faisant progresser l’état de l’art dans trois domaines critiques : clustering de graphes spatiotemporels, prédiction topologique d’ordre supérieur et atténuation du décalage de distribution. Premièrement, nous abordons le clustering de graphes spatiotemporels et l’analyse de données mobiles. Les méthodes traditionnelles traitent les séries temporelles indépendamment, ignorant les relations spatiales et produisant des résultats fragmentés. Nous proposons des méthodes découvrant les structures urbaines latentes au-delà de l’analyse purement temporelle : 1) l’identification de signatures sociales via le clustering spatiotemporel de consommation mobile, révélant diverses fonctions urbaines (résidentiel, affaires, loisirs), et 2) un clustering urbain à grille fine modélisant conjointement les dépendances spatiotemporelles profondes via des réseaux convolutifs et récurrents. Ces contributions aident urbanistes et opérateurs à optimiser les ressources selon les dynamiques réelles. La validation sur des métadonnées mobiles métropolitaines prouve que notre approche capture des motifs à de multiples échelles, des vastes régions aux micro-dynamiques invisibles aux résolutions classiques. Deuxièmement, nous traitons les limites structurelles des modèles de graphes en prévision et imputation spatiotemporelles. Les méthodes actuelles encodent les relations spatiales via des graphes, limités aux connexions par paires. Cette perspective est restrictive, de nombreux phénomènes urbains impliquant des interactions collectives d’ordre supérieur, indécomposables en simples paires. Pour y remédier, cette thèse introduit les complexes simpliciaux comme cadre topologique représentant ces relations complexes. Nous proposons un réseau de neurones spatiotemporel simplicial conscient de la structure, étendant le passage de messages aux simplexes de dimensions arbitraires (sommets, arêtes, triangles). Cette architecture capture comportements synchronisés et motifs régionaux via des mécanismes d’attention et un flux d’information bidirectionnel entre dimensions, améliorant l’expressivité et la précision prédictive. Les expériences sur des données (trafic, environnement, télécommunications) montrent des améliorations substantielles face aux graphes classiques, particulièrement pour les prévisions à long terme et données manquantes. Troisièmement, nous affrontons la fragilité statistique due au décalage de distribution spatiotemporel, qui couple dérive temporelle et hétérogénéité spatiale. Les normalisations existantes ignorent la topologie spatiale, traitant chaque nœud indépendamment et échouant en environnement dynamique. Nous développons un cadre basé sur des réseaux de normalisation réversibles pour détecter, caractériser et s’adapter aux changements de distribution. Notre approche offre des transformations rigoureusement réversibles et spatialement conscientes, garantissant la restauration des statistiques originales tout en assurant des prédictions robustes en milieu dynamique. En résumé, cette thèse présente un corpus unifié allant de l’analyse fondamentale des données mobiles à la prévision robuste de réseaux. En combinant des méthodes innovantes (clustering, modélisation topologique, adaptation aux décalages), nos travaux offrent de solides garanties théoriques et des algorithmes pratiques accélérant les applications des systèmes en réseau complexes.
Abstract :
The proliferation of location-aware sensor networks and mobile data has made spatiotemporal deep learning central to understanding networked dynamics. However, extracting actionable insights requires overcoming fundamental challenges in pattern discovery, structural modeling, and statistical robustness. This thesis presents a cohesive framework advancing the state-of-the-art across three critical areas: Spatiotemporal Graph Clustering, Higher-Order Topological Prediction, and Distribution Shift Mitigation. First, we address Spatiotemporal Graph Clustering and Mobile Data Analytics. Traditional methods treat time series independently, ignoring spatial relationships and producing fragmented results. We propose novel methods to discover latent urban structures beyond temporal-only analysis. This includes: 1) identifying social signatures via spatiotemporal clustering of mobile service consumption to reveal distinct urban functions (e.g., residential, business, and entertainment zones), and 2) performing fine-grained urban grid clustering by jointly modeling deep spatiotemporal dependencies using convolutional and recurrent neural networks. These contributions enable urban planners and telecom operators to delineate functional zones and optimize resources based on actual user dynamics. Validation on metropolitan mobile metadata demonstrates our approach captures meaningful patterns at multiple scales, from coarse regions to micro-scale dynamics invisible at traditional resolutions. Second, we tackle the structural limitations of existing graph-based models in Spatiotemporal Forecasting and Imputation. Current methods encode spatial relationships through graphs, capturing only pairwise connections. This node-centric perspective is restrictive, as many urban phenomena involve collective, multi-way interactions that cannot be decomposed into pairwise components. To overcome this, this thesis introduces simplicial complexes as a topological framework for representing higher-order spatiotemporal relationships. We propose the Structure-Aware Simplicial Spatiotemporal Neural Network, which extends message-passing to simplices of arbitrary dimensions (vertices, edges, triangles, etc.). This architecture captures synchronized behaviors and regional patterns via specialized attention mechanisms and bidirectional information flow across simplex dimensions, enhancing expressive power and prediction accuracy. Experiments on traffic, environmental, and telecom datasets show substantial improvements over graph neural network baselines, particularly in long-term forecasting and extensive missing data scenarios. Third, we tackle statistical fragility caused by spatiotemporal distribution shifts, which couple temporal drift and spatial heterogeneity. Existing normalization methods process nodes independently, ignoring graph topology, and fail to ensure reliability in dynamic environments. We develop a comprehensive framework using reversible normalization networks to detect, characterize, and adapt to distribution changes across spatial and temporal scales. Our approach achieves rigorously reversible, spatially-aware transformations that restore original statistical properties while enabling robust predictions in dynamically shifting environments. In summary, this thesis presents a unified body of work progressing from foundational mobile data analytics to robust network forecasting and imputation. By combining innovative methods for graph clustering, topological modeling, and distribution shift adaptation, our contributions provide strong theoretical guarantees and practical algorithms to accelerate applications in complex networked systems.
