SOUTENANCE : Thèses de Selwa Rafi

«Chaînes de Markov cachées et séparation non supervisée de sources».

lundi 11 juin 2012 à 14h30 en salle C06 – 9 rue Charles Fourier, 91000 Evry.

Jury :

— M. Ali Mohammad-Djafari, DR-CNRS à Supélec-Univ. Paris-Sud (rapporteur)

— M. Christian Jutten, Professeur à l’Université Grenoble I (rapporteur)

— M. Pierre Comon, DR-CNRS à I3S Sophia Antipolis

— M. Yannick Deville, Professeur à l’Université Toulouse 3

— M. Michel Broniatowski, Professeur à l’Université Paris 6

— M. Wojciech Pieczynski, Professeur à Télécom SudParis (directeur de thèse)

— M. Marc Castella, Maître de Conférences à Télécom SudParis (co-encadrant)

Résumé

Le problème de la restauration est rencontré dans domaines très variés notamment en traitement de signal et de l’image. Il correspond à la récupération des données originales à partir de données observées. Dans le cas de données multidimensionnelles, la résolution de ce problème peut se faire par différentes approches selon la nature des données, l’opérateur de transformation et la présence ou non de bruit.

Dans ce travail, nous avons traité ce problème, d’une part, dans le cas de données discrètes en présence de bruit. Dans ce cas, le problème de restauration est analogue à celui de la segmentation. Nous avons alors exploité les modélisations dites chaînes de Markov couples et triplets qui généralisent les chaînes de Markov cachées. L’intérêt de ces modèles réside en la possibilité de généraliser la méthode de calcul de la probabilité a posteriori, ce qui permet une segmentation bayésienne. Nous avons considéré ces méthodes pour des observations bi-dimensionnelles et nous avons appliqué les algorithmes pour une séparation sur des documents issus de manuscrits scannés dans lesquels les textes des deux faces d’une feuille se mélangeaient.

D’autre part, nous avons attaqué le problème de la restauration dans un contexte de séparation aveugle de sources. Une méthode classique en séparation aveugle de sources, connue sous l’appellation « Analyse en Composantes Indépendantes » (ACI), nécessite l’hypothèse d’indépendance statistique des sources. Dans des situations réelles, cette hypothèse n’est pas toujours vérifiée. Par conséquent, nous avons étudié une extension du modèle ACI dans le cas où les sources peuvent être statistiquement dépendantes. Pour ce faire, nous avons introduit un processus latent qui gouverne la dépendance et/ou l’indépendance des sources. Le modèle que nous proposons combine un modèle de mélange linéaire instantané tel que celui donné par ACI et un modèle probabiliste sur les sources avec variables cachées. Dans ce cadre, nous montrons comment la technique d’Estimation Conditionnelle Itérative permet d’affaiblir l’hypothèse usuelle d’indépendance en une hypothèse d’indépendance conditionnelle.

Mots-Clés: Modèles de Markov cachés, Modèles de Markov Couples et Triplets, Estimation Bayésienne, Séparation aveugle de sources, Analyse en Composantes Indépendantes, Estimation Conditionnelle Itérative