Bonjour chers participants à GSI’15,
En association avec le GDR CNRS ISIS, nous organisons le 4 Décembre 2015 une journée sur le thème :
Outils en géométrie de l’information et probabilités dans les espaces abstraits pour le traitement du signal et des images
Lieu de la journée: AMUE, Salle de conférence, 103 bd Saint-Michel, 75005 Paris (http://www.amue.fr/presentation/les-sites/le-site-du-103/)
(l’exposé de Gautier Marti a été annulé, mais sera remplacé par un autre exposé).
l’inscription est gratuite mais obligatoire.
Annonce
Le GdR ISIS, sous le patronnage du GdR MIA, organise une journée le 4/12/2015 sur la géométrie de l’information et les probabilités dans les espaces abstraits pour le traitement du signal et de l’image au sens large.
Le domaine de la géométrie de l’information et des probabilités dans les espaces abstraits (variétés différentielles, espaces métriques, graphes), qui s’appuient sur des résultats de mathématiciens, physiciens et de statisticiens de renoms tels que, sans être exhaustif, Fréchet, Koszul, Souriau, Balian, Fisher, Rao, Chentsov, Amari, offre aujourd’hui un cadre mature propice à générer de nouvelles avancées pour la communauté des traiteurs du signal et de l’image au sens large. En effet, abordant les problèmes de détection, d’estimation ou de classification sous l’angle de la géométrie différentielle et de la géométrie dans les espaces métriques, la géométrie de l’information et les probabilités dans les espaces abstraits permettent d’envisager des solutions à la fois élégantes et numériquement efficaces à de nombreux problèmes génériques en traitement du signal et de l’image, classiquement traités par l’algèbre linéaire. Enfin, ces approches géométriques ont notamment l’intérêt d’exploiter des métriques invariantes et ainsi d’écarter tout arbitraire dans le choix des formes considérées ou du système de coordonnées.
Ainsi, en géométrie de l’information, une source (signal, image, vidéo, etc.) sera vue comme un point dans un espace métrique. Un tel espace est généralement une variété dotée d’une métrique riemannienne, ou pseudo-riemannienne grâce à laquelle il est possible de définir toute une série de grandeurs intrinsèques d’intérêt pour résoudre des problèmes visant à classer, analyser ou interpréter des signaux, images ou vidéo. En probabilité dans les espaces abstraits, il s’agit de façon similaire de redéfinir la notion de mesure et de densité sur ces variétés, ainsi que les outils statistiques associés.
L’enjeu pour nous traiteurs du signal et de l’image est donc de savoir si l’utilisation de mesures, de critères, de lois a priori intrinsèques à ces espaces permet d’obtenir de nouveaux algorithmes, ou à défaut une meilleure connaissance de ceux qui existent déjà et une plus profonde connaissance des structures de l’information traitée.
L’objet de la journée organisée par le GdR ISIS vise à permettre à notre communauté de faire un point sur les derniers développements en géométrie de l’information et en probabilités dans les espaces abstraits, et de favoriser les échanges interdisciplinaires avec la communauté des mathématiques et de la physique statistique. Elle s’organisera autour de plusieurs exposés sur un format « tutoriel» et un format court d’expression pour les doctorants travaillant sur ces aspects.
Frédéric Barbaresco : frederic.barbaresco@thalesgroup.com
Yannick Berthoumieu : yannick.berthoumieu@ims-bordeaux.fr
Programme
Session tutoriel
09h30-10h20 | Borne de Cramer-Rao intrinsèque sur les groupes de Lie – Silvère Bonnabel : MINES ParisTech, PSL Research University, Centre for robotics |
10h20-10h50 | Pause Café |
10h50-11h40 | Lois Gaussiennes dans les espaces de matrices de covariance : nouveaux outils pour ?apprentissage statistique ? Salem Said Université de Bordeaux |
11h40-12h30 | Quelques résultats récents en géométrie différentielle et ses applications en analyse de formes 3D et la reconnaissance d?activités humaines – Mohamed Daoudi (Professeur), CRIStAL (UMR 9189), Telecom Lille |
12h30-13h30 | – Pause Déjeuner |
Session après-midi
13h30-13h50 | Classification multi-utilisateurs simultanée de signaux électro-encéphalographiques par géométrie Riemannienne – Louis Korczowski, Marco Congedo, and Christian Jutten Univ. Grenoble Alpes, GIPSA-lab |
13h50-14h10 | Interpolation riemannienne pour l’estimation de la covariance d’un canal de communication – Alexis Decurninge, Huawei Technologies |
14h10-14h30 | Distance entre chemins dans une variété différentielle – Alice Le Brigant, Université de Bordeaux et THALES AIR SYSTEMS |
14h30-14h50 | Estimation non paramétrique de densité de probabilité sur les espaces de lois Gaussiennes munies de métriques Riemanniennes – Emmanuel Chevallier, Ecole des Mines ParisTech, Fontainebleau |
14h50-15h10 | Optimisation au deuxième ordre sur la variété des distributions gaussiennes – Luigi Malago, Shinshu University |
15h10-15h40 | Pause Café |
15h40-16h00 | Estimation adaptative pour les modèles de mélange dans les familles exponentielles – Christophe Saint-Jean, Université de La Rochelle |
16h00-16h20 | Détection de changements sur filtres de Kalman : utilisation de la distance entre modèles multivariés gaussiens au sens de la géométrie de l’information, estimée par tirs géodésiques ou calcul de bornes. Marion Pilté, Ecole des Mines ParisTech et THALES AIR SYSTEMS |
16h20-16h40 | Comment la géométrie de l’information peut aider à développer des indicateurs robustes du risque de marché ? – Gautier Marti, Hellebore Capital Management |
16h40-17h00 | Espaces de courbes: métriques et densités – S. Puechmorel et F. Nicol, ENAC, Toulouse |
Résumés des contributions
Borne de Cramer-Rao intrinsèque sur les groupes de Lie – Silvère Bonnabel : MINES ParisTech, PSL Research University, Centre for robotics
Résumé :
La borne de Cramer-Rao intrinsèque permet de trouver une borne inférieure pour un estimateur pour le problème de Wahba, qui consiste à trouver estimer une rotation à partir de la mesure bruitée de l’image (bruitée) par cette rotation d’un certain nombre de vecteurs connus, comme par exemple un satellite qui mesure un champ magnétique et/ou traque des étoiles fixes, ou le soleil etc.
Dans ce contexte, nous aborderons le filtrage de Kalman sur les groupes de Lie, puisque lorsqu’on fait un filtre de Kalman invariant sur SO(3) pour disons par exemple une caméra équipée de gyros et qui mesure des directions connues (des étoiles lointaines par exemple). On peut montrer que la covariance calculée par le filtre de Kalman correspond à la borne de Cramer-Rao, ce qui est en général impossible puisque calculer la borne de Cramer-Rao dans les problèmes de filtrage dynamique de ce type implique de connaître l’état vrai du système.
Lois Gaussiennes dans les espaces de matrices de covariance : nouveaux outils pour l’apprentissage statistique Salem Said, Université de Bordeaux
Résumé :
On peut définir les lois Gaussiennes sur la ligne réelle comme lois vérifiant la propriété que « le maximum de vraisemblance est équivalent au problème des moindres carrés ». Cette définition se généralise directement, de la ligne réelle, à tous les espaces Riemanniens homogènes de courbure négative. Ainsi, il est possible d’envisager le problème des moindres carrés, (autrement dit, du calcul de barycentre), dans ce type d’espace Riemannien, à travers le cadre de la statistique inférentielle.
La géométrie de l’information fait apparaitre les espaces de matrices de covariance justement comme des espaces Riemanniens homogènes de courbure négative, (cône des matrices symétriques définies positives, disque de Siegel, etc). La généralisation des lois Gaussiennes à ces espaces de matrices de covariance donne lieu à un formalisme intuitif et performant pour les problèmes d’apprentissage statistique.
Le séminaire portera sur trois aspects 1) géométrie de l?information et espaces Riemanniens homogènes de courbure négative, 2) lois Gaussiennes dans les espaces Riemanniens homogènes de courbure négative, 3) inférence statistique et apprentissage.
http://arxiv.org/abs/1507.01760
Quelques résultats récents en géométrie différentielle et ses applications en analyse de formes 3D et la reconnaissance d?activités humaines – Mohamed Daoudi (Professeur), CRIStAL (UMR 9189), Telecom Lille
Résumé :
En vision par ordinateur, les formes des objets sont représentées de nombreuses façons différentes. Les courbes, les surfaces ou les squelettes ne sont que quelques exemples d’objets qu’on peut trouver dans la littérature. Ces objets vivent dans des espaces de formes intrinsèquement non linéaires. A cause de cette non-linéarité, il est par exemple difficile de calculer des statistiques telles que la moyenne et la matrice de covariance. Une façon de surmonter cette difficulté est de doter ces espaces de formes (variétés) d’une métrique riemannienne. Cela nous permet de linéariser localement l’espace des formes et de développer des statistiques basées sur des approches géodésiques. Un autre avantage de la géométrie riemannienne est de proposer une définition intuitive de similarité entre deux formes, basée sur la notion de distance géodésique.
Dans cet exposé, nous présenterons des résultats récents où les objets à manipuler peuvent prendre différentes formes telles que des trajectoires représentant des actions humaines (1), des surfaces faciales (2), des squelettes de corps humains (3) ou des surfaces d’objets 3D (4). Tous ces objets seront représentés par des points dans des variétés riemanniennes. Enfin, nous montrerons comment des séquences vidéo d’actions humaines peuvent être représentées dans des variétés de Grassmann où les points de cette variété sont des matrices représentant des sous-séquences vidéo (5).
(1) M. Devanne, H. Wannous, S. Berretti, P. Pala, M. Daoudi, A. Del Bimbo. 3-D Human Action Recognition by Shape Analysis of Motion Trajectories on Riemannian Manifold. IEEE T. Cybernetics 45(7): 1340-1352 (2015)
(2) H. Drira, B. Ben Amor, A. Srivastava, M. Daoudi, R. Slama: 3D Face Recognition under Expressions, Occlusions, and Pose Variations. IEEE TPAMI, 35(9): 2270-2283 (2013)
(3) B. Ben Amor, S. Jingyong A. Srivastava, Action Recognition Using Rate-Invariant Analysis of Skeletal Shape Trajectories. IEEE TPAMI, 2015, To appear
(4) A. B. Tumpach, H. Drira, M. Daoudi, and A. Srivastava. Gauge Invariant Framework for Shape Analysis of Surfaces. IEEE TPAMI, page 1, April 2015. To appear.
(5) R. Slama, H. Wannous, M. Daoudi, and A. Srivastava, Accurate 3D action recognition using learning on the Grassmann manifold. Pattern Recognition, 48(2):556?567, 2015.
Classification multi-utilisateurs simultanée de signaux électro-encéphalographiques par géométrie Riemannienne – Louis Korczowski, Marco Congedo, and Christian Jutten Univ. Grenoble Alpes, GIPSA-lab
Résumé :
La dernière décennie a permis une amélioration drastique des interfaces cerveau-ordinateur (ICO) non-invasives tant du point de vue des méthodes de classification que de la portabilité des équipements d’enregistrement. Cependant, ces systèmes nécessitent un temps de calibration important (apprentissage) qui limite leur ergonomie et robustesse.
Afin de s’émanciper de cette calibration, nous proposons de modéliser les données électroencéphalographiques (EEG) par leur seule matrice covariance étendue pour inclure les statistiques spatio-temporelle. De telles matrices, étant Symétriques Définies Positives (SDP), seront manipulées dans la variété de Riemann des matrices SDP plutôt que dans l’espace Euclidien. Cette manipulation, bien que simple, permet d’atteindre des performances de classification équivalentes voir supérieures à l’état de l’art en ayant l’avantage d’être robuste à l’apprentissage par transfert et potentiellement adaptatif au cours d’une session. Dernièrement cette méthode, couplée à d’autres approches, a montré sa fiabilité :
1er au classement des compétitions DecMeg2014 – Decoding the Human Brain ; BCI Challenge @NER 2015 ; Grasp-and-Lift EEG Detection 2015.
Nos travaux récents portent sur l?extension de la classification Riemannienne en multi-utilisateurs avec deux approches. Dans la première, chaque sujet possède son propre espace de Riemann où leurs matrices de covariance sont traitées de manière indépendantes. Dans la seconde, les matrices de variance-covariance des deux sujets sont fusionnées pour n’être qu’un point dans un espace de Riemann de dimension supérieure, incluant les statistiques intra- et inter-sujets. Nous comparerons, en terme de classification, ces deux approches multi-utilisateurs sur une application d’interface cerveau-ordinateur basée sur la classification de potentiels évoqués P300 appelée Brain Invaders.
Interpolation riemannienne pour l’estimation de la covariance d’un canal de communication – Alexis Decurninge, Huawei Technologies
Résumé :
Pour des systèmes de télécommunication MIMO en mode de duplexage en fréquences, la connaissance de la covariance du canal émerge comme un ingrédient essentiel pour l’acquisition du canal instantané.
Cependant, dans ce contexte, il n’existe pas de relation simple permettant de déduire la covariance du lien descendant grâce à la covariance du lien montant plus facile à obtenir. On présentera des méthodes d’interpolation de la matrice de covariance du lien descendant à partir de celle du lien montant et d’un dictionnaire de paires de matrices de covariance montant/descendant.
Distance entre chemins dans une variété différentielle – Alice Le Brigant , Université de Bordeaux et THALES AIR SYSTEMS
Résumé :
De nombreuses applications nécessitent l’étude et la comparaison de trajectoires, qui tracent des chemins dans des espaces plats ou non selon l’application. Nous allons donc munir l’espace de ces chemins d’une métrique afin de pouvoir y faire des statistiques très basiques : calculer par exemple une moyenne ou une médiane de plusieurs chemins. Nous y parviendrons en munissant l’espace de chemins d’une structure Riemannienne, c’est-à-dire en le linéarisant localement autour de chaque chemin, et nous caractériserons les géodésiques pour notre métrique Riemannienne, ce qui nous donnera les déformations optimales entre deux chemins.
Estimation non paramétrique de densité de probabilité sur les espaces de lois Gaussiennes munies de métriques Riemanniennes – Emmanuel Chevallier, Ecole des Mines ParisTech, Fontainebleau
Résumé :
Le traitement du signal et de l’image manipule des données se trouvant dans des espaces de plus en plus variés. Chaque type de données a ses propres structures algébriques et géométriques. Les lois Gaussiennes et les matrices symétriques définies positives sont de plus en plus présentes en traitement du signal et de l’image, d’où l’intérêt de l’étude de la géométrie de ces espaces. Cette présentation porte sur l’estimation de densités de probabilités dans le cas de variables aléatoires à valeurs dans les lois gaussiennes. L’étude se place principalement dans le contexte des géométries induites par les métriques de Fisher et de Wasserstein.
Optimisation au deuxième ordre sur la variété des distributions gaussiennes – Luigi Malago, Shinshu University
Résumé:
Un problème de minimisation peut être relaxé dans la minimisation de l’espérance d’une fonction objectif réelle sur les probabilités d’un modèle statistique dont la fermeture contient une distribution concentrée sur des minima. En particulier, le modèle statistique gaussien est naturellement doué d’une structure de variété différentiable Riemannienne et son fibré de plusieurs connexions et transports naturels. Nous explorons l’application de la méthode de Newton basée sur la forme spécifique du hessien et des géodésiques associées à chaque connexion.
Estimation adaptative pour les modèles de mélange dans les familles exponentielles – Christophe Saint-Jean, Université de La Rochelle
Résumé :
Dans cet exposé, je rappellerai dans un premier temps les définitions de base sur les familles exponentielles et les modèles finis de mélange. Puis, je détaillerai l’algorithme EM pour ce type de modèle, ainsi que diverses extensions « online » où il s’agit d’ajuster le mélange lorsque les données arrivent une par une. Plusieurs applications au traitement du signal et des images seront présentées (par exemple analyse colorimétrique des images , analyse de trajectoires pour des données de « motion-capture »).
Détection de changements sur filtres de Kalman : utilisation de la distance entre modèles multivariés gaussiens au sens de la géométrie de l’information, estimée par tirs géodésiques ou calcul de bornes Marion Pilté, Ecole des Mines ParisTech et THALES AIR SYSTEMS
Résumé :
L’objectif est d?utiliser la géométrie différentielle afin de détecter des changements de bruits le plus rapidement possible en sortie d’un filtre de kalman. La méthode de détection que l?on propose utilise les données en sortie d’un filtre de Kalman multi-modèle. Le filtre de Kalman nous donne accès à des vecteurs d’état (x_k), et des matrices de covariance (P_(k|k)), que l’on peut voir comme les paramètres d’une distribution (par exemple gaussienne multivariée). On modélise le problème sur la variété des gaussiennes multivariées au sens de la géométrie de l?information, pour laquelle on introduit une distance pertinente, c’est l’objet de cette présentation. Les distances seront le pilier de notre détection de changement : on les utilisera pour comparer l’écart entre l’estimation de la mesure à l’instant k et la prédiction à ce même instant k. Schématiquement, on peut dire que si la distance est « grande », il y a une forte présomption en faveur d?un changement de modèle. Inversement, si la distance est « faible », on peut supposer que le signal continu à suivre le même modèle. On comparera des méthodes basées sur des tirs géodésiques et des méthodes basées sur l’établissement de bornes pour le calcul des distances au sens de la géométrie de l’information. On introduira également des méthodes de calcul de moyenne/médiane dans ces espaces via le calcul de barycentre de Fréchet par flot de Karcher pour les gaussiennes multivariées.
Références :
[1] Takuro Imai, Akira Takaesu, Masato Wakayama. s.l. Remarks on geodesics for multivariate normal models., Math-for-industry, 2011, Vol. 3
[2] Eriksen, P.S., Geodesics connected with the Fisher metric on the multivariate normal manifold. Lancaster : Proceedings of the GST Workshop, 1987.
[3] Minyeon Han, F.C. Park. s.l., DTI Segmentation and Fiber Tracking Using Metrics on Multivariate Normal Distributions. : J Math Imaging Vis, 2013.
[4] M. Calvo, J.M. Oller., An explicit solution of information geodesic equations for the multivariate normal model. 119-138, s.l. , Statistics & Decisions, 1990.
[5] João E. Strapasson, Julianna P.S. Porto, Sueli I.R. Costa. distributions, On bounds for the Fisher-Rao distance between multivariate normal. 2013.
[6] J. Strapasson, J. Porto, S. Costa., Brazil On bounds for the Fisher-Rao distance between multivariate normal distributions, s.n., 2013.
[7] A. Dessein, A. Cont. , An Information-Geometric Approach to Real-Time Audio Segmentation. Paris : IEEE, 2013.
[8] M. Calvo, J. Oller. s.l., A distance between elliptical distributions based in an embedding into the Siegel group. : Journal of Computational and Applied Mathematics, 2001.
[9] Hiroto Inoue, Group Theoretical Study on Geodesics for the Elliptical Models, GSI?15 Proceedings, SPRINGER Lecture Note, October 2015
[10] Yang Le, Médianes de mesures de probabilité dans les variétés riemanniennes et applications à la détection de cibles radar, thèse université de Poitiers, 2011, supervisée par Marc Arnaudon et Frédéric Barbaresco, https://tel.archives-ouvertes.fr/tel-00664188/
Comment la géométrie de l’information peut aider à développer des indicateurs robustes du risque de marché ? – Gautier Marti, Hellebore Capital Management
Résumé :
L’approche usuelle pour calculer une « valeur à risque » requiert l’utilisation d’une matrice de variance-covariance empirique. Laloux et al. (1999) ont montré que cette matrice de variance-covariance empirique contenait essentiellement du bruit en comparant son spectre aux distributions du type « Marchenko?Pastur » des valeurs propres de grandes matrices aléatoires. Ce constat motive le besoin de filtrer ces matrices : réduire le bruit tout en préservant les principaux axes de risque du marché.
La même année, Mantegna et al. (1999) ont proposé une approche fondée sur le clustering pour filtrer ces matrices :
utiliser un algorithme de clustering hiérarchique et en extraire un nombre maximal de cluster correspondant alors aux axes de risque, puis filtrer les coefficients en accord avec la structure du clustering.
Les efforts des chercheurs dans ce domaine ont alors été orientés vers l’algorithmique pour constituer les clusters à partir d’une matrice de corrélation de Pearson.
Cependant, la corrélation de Pearson est une mesure simpliste et peu robuste de la dépendance, surtout lorsque l’on considère des distributions à queues lourdes comme c’est le cas en finance quantitative.
La géométrie de l’information permet alors d’aborder la similarité entre ces séries temporelles financières [1] de manière raisonnée : on cherche de bonnes distances entre variables aléatoires dépendantes [2]. La structure de dépendance est elle-même une distribution appelée la copule. Développer une géométrie des copules (et des variables aléatoires dépendantes) est un axe de recherche pour exploiter cette information afin d’obtenir des clusterings plus pertinents [3] et plus robustes aux perturbations [4].
[1] Marti, G., Nielsen, F., Very, P., & Donnat, P. (2015). Clustering Random Walk Time Series. In Geometric Science of Information (pp. 675-684). Springer International Publishing.
[2] Marti, G., Very, P., & Donnat, P. (2015). Toward a generic representation of random variables for machine learning. arXiv preprint arXiv:1506.00976.
[3] On the consistency of clustering correlated random variables, submitted AISTATS 2016
[4] Marti, G., Very, P., Donnat, P., & Nielsen, F. (2015). A proposal of a methodological framework with experimental guidelines to investigate clustering stability on financial time series. IEEE ICMLA 2015.
Espaces de courbes: métriques et densités – S. Puechmorel et F. Nicol, ENAC, Toulouse
Résumé :
Dans de nombreuses applications, les objets traités peuvent être décrits comme des courbes géométriques. C’est en particulier le cas dans le domaine du trafic aérien où on s’interesse à la forme des trajectoires suivies par les avions. De façon formelle, une courbe sera considérée comme un point dans une variété obtenue en quotientant un espace d’immersions par le groupe des difféomorphismes de [0,1]. Les travaux fondateurs de Mumford et Michor ont proposé diverses métriques sur ces variétés. Une autre approche consiste à représenter les courbes comme des sous-variétés riemaniennes et à utiliser une notion de distance entre elles. Enfin, il est souvent utile d’associer à une courbe ou un système de courbes une densité spatiale. Nous présenterons dans cet exposé des résultats récents concernant ces deux problèmes ainsi que des illustrations sur des données réelles de trafic aérien.
Frédéric Barbaresco & Yannick Berthoumieu