AVIS DE SOUTENANCE de Monsieur Thibault LELONG

L’Ecole doctorale : Ecole Doctorale de l’Institut Polytechnique de Paris

et le Laboratoire de recherche SAMOVAR – Services répartis, Architectures, Modélisation, Validation, Administration des Réseaux

présentent

l’AVIS DE SOUTENANCE de Monsieur Thibault LELONG

Autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l’Institut Polytechnique de Paris, préparé à Télécom SudParis en :

Signal, Images, Automatique et robotique

« Reconnaissance des documents avec de l’apprentissage profond pour la réalité augmentée »

le MARDI 12 DÉCEMBRE 2023 à 10h00

à
Télécom SudParis
C06
9 rue Charles Fourier 91011 EVRY

Membres du jury :

M. Titus ZAHARIA, Professeur, Télécom SudParis, FRANCE – Directeur de these
M. Marius PREDA, Maître de conférences, Télécom SudParis, FRANCE – Co-encadrant de these
M. Christophe GRAVIER, Professeur, Télécom Saint-Etienne, FRANCE – Rapporteur
M. Valeriu VRABIE, Professeur, Université de Reims Champagne-Ardenne, FRANCE – Rapporteur
M. Mihai CIUC, Professeur, Polytechnic University of Bucharest, ROUMANIE – Examinateur
M. Emmanuel BRICARD, Ingénieur, Shift89, Sparkles3, FRANCE – Examinateur

« Reconnaissance des documents avec de l’apprentissage profond pour la réalité augmentée »

présenté par Monsieur Thibault LELONG

Résumé :

Ce projet doctoral se focalise sur les problématiques associées à l’identification d’images et de documents dans les applications de réalité augmentée utilisant des marqueurs, en particulier lors de l’utilisation d’appareils photo. La recherche s’inscrit dans un contexte technologique où l’interaction via la réalité augmentée est essentielle dans plusieurs domaines, y compris l’industrie, qui requièrent des méthodologies d’identification fiables. Dans une première phase, le projet évalue diverses méthodologies d’identification et de traitement d’image au moyen d’une base de données spécialement conçue pour refléter les défis du contexte industriel. Cette recherche permet une analyse approfondie des méthodologies existantes, révélant ainsi leurs potentiels et leurs limites dans divers scénarios d’application. Par la suite, le projet propose un système de détection de documents visant à améliorer les solutions existantes, optimisé pour des environnements tels que les navigateurs web. Ensuite, une méthodologie innovante pour la recherche d’images est introduite, s’appuyant sur une analyse de l’image en sous-parties afin d’accroître la précision de l’identification et d’éviter les confusions d’images. Cette approche permet une identification plus précise et adaptative, notamment en ce qui concerne les variations de la mise en page de l’image cible. Enfin, dans le cadre de travaux en collaboration avec la société ARGO, un moteur de suivi d’image en temps réel a été développé, optimisé pour des appareils à basse puissance et pour les environnements web. Ceci assure le déploiement d’applications web en réalité augmentée et leur fonctionnement sur un large éventail de dispositifs, y compris ceux dotés de capacités de traitement limitées. Il est à noter que les travaux issus de ce projet doctoral ont été appliqués et valorisés concrètement par la société Argo à des fins commerciales, confirmant ainsi la pertinence et la viabilité des méthodologies et solutions développées, et attestant de leur contribution significative au domaine technologique et industriel de la réalité augmentée.

Abstract :

This doctoral project focuses on issues related to the identification of images and documents in augmented reality applications using markers, particularly when using cameras. The research is set in a technological context where interaction through augmented reality is essential in several domains, including industry, which require reliable identification methodologies. In an initial phase, the project assesses various identification and image processing methodologies using a database specially designed to reflect the challenges of the industrial context. This research allows an in-depth analysis of existing methodologies, thus revealing their potentials and limitations in various application scenarios. Subsequently, the project proposes a document detection system aimed at enhancing existing solutions, optimized for environments such as web browsers. Then, an innovative image research methodology is introduced, relying on an analysis of the image in sub-parts to increase the accuracy of identification and avoid image confusions. This approach allows for more precise and adaptive identification, particularly with respect to variations in the layout of the target image. Finally, in the context of collaborative work with ARGO company, a real-time image tracking engine was developed, optimized for low-power devices and web environments. This ensures the deployment of augmented reality web applications and their operation on a wide range of devices, including those with limited processing capabilities. It is noteworthy that the works resulting from this doctoral project have been concretely applied and valorized by the Argo company for commercial purposes, thereby confirming the relevance and viability of the developed methodologies and solutions, and attesting to their significant contribution to the technological and industrial field of augmented reality.