AVIS DE SOUTENANCE de Monsieur Thibault LELONG

L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris

et le Laboratoire de recherche SAMOVAR – Services rĂ©partis, Architectures, ModĂ©lisation, Validation, Administration des RĂ©seaux

présentent

l’AVIS DE SOUTENANCE de Monsieur Thibault LELONG

AutorisĂ© Ă  prĂ©senter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, prĂ©parĂ© Ă  TĂ©lĂ©com SudParis en :

Signal, Images, Automatique et robotique

« Reconnaissance des documents avec de l’apprentissage profond pour la rĂ©alitĂ© augmentĂ©e »

le MARDI 12 DÉCEMBRE 2023 Ă  10h00

Ă 
Télécom SudParis
C06
9 rue Charles Fourier 91011 EVRY

Membres du jury :

M. Titus ZAHARIA, Professeur, TĂ©lĂ©com SudParis, FRANCE – Directeur de these
M. Marius PREDA, MaĂźtre de confĂ©rences, TĂ©lĂ©com SudParis, FRANCE – Co-encadrant de these
M. Christophe GRAVIER, Professeur, TĂ©lĂ©com Saint-Etienne, FRANCE – Rapporteur
M. Valeriu VRABIE, Professeur, UniversitĂ© de Reims Champagne-Ardenne, FRANCE – Rapporteur
M. Mihai CIUC, Professeur, Polytechnic University of Bucharest, ROUMANIE – Examinateur
M. Emmanuel BRICARD, IngĂ©nieur, Shift89, Sparkles3, FRANCE – Examinateur

« Reconnaissance des documents avec de l’apprentissage profond pour la rĂ©alitĂ© augmentĂ©e »

présenté par Monsieur Thibault LELONG

Résumé :

Ce projet doctoral se focalise sur les problĂ©matiques associĂ©es Ă  l’identification d’images et de documents dans les applications de rĂ©alitĂ© augmentĂ©e utilisant des marqueurs, en particulier lors de l’utilisation d’appareils photo. La recherche s’inscrit dans un contexte technologique oĂč l’interaction via la rĂ©alitĂ© augmentĂ©e est essentielle dans plusieurs domaines, y compris l’industrie, qui requiĂšrent des mĂ©thodologies d’identification fiables. Dans une premiĂšre phase, le projet Ă©value diverses mĂ©thodologies d’identification et de traitement d’image au moyen d’une base de donnĂ©es spĂ©cialement conçue pour reflĂ©ter les dĂ©fis du contexte industriel. Cette recherche permet une analyse approfondie des mĂ©thodologies existantes, rĂ©vĂ©lant ainsi leurs potentiels et leurs limites dans divers scĂ©narios d’application. Par la suite, le projet propose un systĂšme de dĂ©tection de documents visant Ă  amĂ©liorer les solutions existantes, optimisĂ© pour des environnements tels que les navigateurs web. Ensuite, une mĂ©thodologie innovante pour la recherche d’images est introduite, s’appuyant sur une analyse de l’image en sous-parties afin d’accroĂźtre la prĂ©cision de l’identification et d’Ă©viter les confusions d’images. Cette approche permet une identification plus prĂ©cise et adaptative, notamment en ce qui concerne les variations de la mise en page de l’image cible. Enfin, dans le cadre de travaux en collaboration avec la sociĂ©tĂ© ARGO, un moteur de suivi d’image en temps rĂ©el a Ă©tĂ© dĂ©veloppĂ©, optimisĂ© pour des appareils Ă  basse puissance et pour les environnements web. Ceci assure le dĂ©ploiement d’applications web en rĂ©alitĂ© augmentĂ©e et leur fonctionnement sur un large Ă©ventail de dispositifs, y compris ceux dotĂ©s de capacitĂ©s de traitement limitĂ©es. Il est Ă  noter que les travaux issus de ce projet doctoral ont Ă©tĂ© appliquĂ©s et valorisĂ©s concrĂštement par la sociĂ©tĂ© Argo Ă  des fins commerciales, confirmant ainsi la pertinence et la viabilitĂ© des mĂ©thodologies et solutions dĂ©veloppĂ©es, et attestant de leur contribution significative au domaine technologique et industriel de la rĂ©alitĂ© augmentĂ©e.

Abstract :

This doctoral project focuses on issues related to the identification of images and documents in augmented reality applications using markers, particularly when using cameras. The research is set in a technological context where interaction through augmented reality is essential in several domains, including industry, which require reliable identification methodologies. In an initial phase, the project assesses various identification and image processing methodologies using a database specially designed to reflect the challenges of the industrial context. This research allows an in-depth analysis of existing methodologies, thus revealing their potentials and limitations in various application scenarios. Subsequently, the project proposes a document detection system aimed at enhancing existing solutions, optimized for environments such as web browsers. Then, an innovative image research methodology is introduced, relying on an analysis of the image in sub-parts to increase the accuracy of identification and avoid image confusions. This approach allows for more precise and adaptive identification, particularly with respect to variations in the layout of the target image. Finally, in the context of collaborative work with ARGO company, a real-time image tracking engine was developed, optimized for low-power devices and web environments. This ensures the deployment of augmented reality web applications and their operation on a wide range of devices, including those with limited processing capabilities. It is noteworthy that the works resulting from this doctoral project have been concretely applied and valorized by the Argo company for commercial purposes, thereby confirming the relevance and viability of the developed methodologies and solutions, and attesting to their significant contribution to the technological and industrial field of augmented reality.