L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris
et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux
présentent
lâAVIS DE SOUTENANCE de Monsieur Hugo DURCHON
AutorisĂ© Ă prĂ©senter ses travaux en vue de lâobtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă TĂ©lĂ©com SudParis en :
Informatique
« MĂ©thodes dâapprentissage profond pour lâestimation de la position et la reconstruction dâobjets en environnement industriel »
le MARDI 18 MARS 2025 Ă 14h00
Ă
C06
Télécom SudParis 9 Rue Charles Fourier 91000 Evry-Courcouronnes FR
Membres du jury :
M. Titus ZAHARIA, Professor, TĂ©lĂ©com SudParis, FRANCE – Directeur de these
M. Valeriu VRABIE, Professor, UniversitĂ© de Reims Champagne-Ardenne, FRANCE – Rapporteur
M. Samir OTMANE, Professor, UniversitĂ© Ăvry Paris-Saclay, FRANCE – Rapporteur
M. JĂ©rĂ©my LACOCHE, Docteur, Orange, FRANCE – Examinateur
M. Francisco MORĂN BURGOS, Professor, Universidad PolitĂ©cnica de Madrid, ESPAGNE – Examinateur
M. Marius PREDA, MaĂźtre de confĂ©rences, TĂ©lĂ©com SudParis, FRANCE – Co-encadrant de these
« MĂ©thodes dâapprentissage profond pour lâestimation de la position et la reconstruction dâobjets en environnement industriel »
présenté par Monsieur Hugo DURCHON
Résumé :
Cette thĂšse aborde les dĂ©fis relatifs Ă la mise en Ćuvre du placement et de l’alignement du contenu virtuel sans marqueurs pour la RĂ©alitĂ© AugmentĂ©e (RA) dans des environnements industriels d’assemblage de chaudiĂšres. MalgrĂ© les potentiels bĂ©nĂ©fices de la RA pour l’industrie, incluant une production accrue ainsi qu’une formation interactive et plus efficiente des opĂ©rateurs, son utilisation reste limitĂ©e dans les environnements de production complexes. Une des limitations technologiques rĂ©side dans l’incapacitĂ© des approches traditionnelles d’alignement du contenu virtuel, tirant parti de marqueurs physiques, Ă opĂ©rer sur des lignes de production entiĂšres, notamment, lorsqu’elles sont composĂ©es d’objets d’intĂ©rĂȘt ou de structures d’assemblage mobiles. Ă travers l’investigation de diverses approches de vision par ordinateur, notre travail aboutit au dĂ©veloppement d’une pipeline innovante combinant les Neural Radiance Fields et les mĂ©thodes d’estimation de position 6D dites « zero-shot ». Cette solution permet l’alignement du contenu virtuel sans marqueurs et sans nĂ©cessiter de donnĂ©es d’entraĂźnement labellisĂ©es ni de modĂšles CAD prĂ©existants. L’approche proposĂ©e dĂ©montre des performances robustes sur diffĂ©rents modĂšles de chaudiĂšres et Ă©tapes d’assemblage. Nos contributions vont au-delĂ de la mise en Ćuvre technique pour inclure des idĂ©es concernant le dĂ©ploiement pratique de solutions de vision par ordinateur dans des environnements industriels, ouvrant la voie Ă une adoption plus gĂ©nĂ©ralisĂ©e de la RA dans le contexte de l’industrie 4.0.
Abstract :
This thesis addresses the challenge of implementing markerless Augmented Reality (AR) in manufacturing environments, focusing on boiler assembly lines. While AR technology shows great promise for improving industrial efficiency through operator training and assistance, its adoption has been limited by difficulties in handling complex production environments. Traditional approaches using markers become impractical when scaling across entire production lines, especially with dynamic objects and assembly structures. Through systematic investigation of various computer vision approaches, from lightweight neural networks to advanced 3D reconstruction techniques, our work culminates in an innovative end-to-end pipeline that combines neural rendering and zero-shot pose estimation techniques. This solution enables markerless AR without requiring extensive manual annotations or pre-existing 3D models, addressing key barriers to industrial AR adoption. The proposed approach demonstrates robust performance across different boiler models and assembly stages, achieving remarkable results in real production conditions. Our contributions extend beyond technical implementation to include valuable insights for deploying computer vision solutions in industrial settings, paving the way for more widespread adoption of AR technology in Industry 4.0 manufacturing environments.