Thèse
Co-dirigée par Ch. Collet et E. Slezak et co-encadrée par S. Lefèvre et V. Mazet
Thèse réalisée à l'Université de Strasbourg au sein du LSIIT
Ressources
- Thèse en ligne : http://tel.archives-ouvertes.fr/tel-00559584/fr/
- Images et paramètres des 1 500 galaxies décomposées : https://paseo.u-strasbg.fr/perret/
- Page de démo sur le site de l'équipe PASEO : http://lsiit-miv.u-strasbg.fr/paseo/galaxyclassification.php
Résumé
Problématique
Dès leur découverte, les galaxies ont été classifiées dans un système basé sur l'apparence de l'objet dans le domaine visible du spectre électromagnétique et comprenant trois morphologies principales : galaxies elliptiques, galaxies spirales et galaxies irrégulières. Or les processus physiques a l'oeuvre dans une galaxie font que cet aspect peut changer selon la longueur d'onde considérée de part les énergies produites et la suite d'absorption/réémission que subissent les photons lorsqu'ils interagissent avec le milieu galactique. Cet aspect peut également évoluer au cours du temps et se traduire par des propriétés dynamiques variables. Pour toutes ces raisons, auxquelles s'ajoutent les biais observationnels, la forme d'une galaxie (sa morphologie spatiale et spectrale) est donc une notion complexe directement liée à son histoire : on peut alors envisager de comprendre comment ces objets se forment puis évoluent pour peu qu'on puisse les caractériser précisément à l'aide d'une modélisation paramétrique quantifiable.
Ce travail de recherche consiste à étudier la représentation multibande des galaxies sous forme d'une composition de structures astrophysiques (bulbe, disque, ...) combinée à un modèle observationnel destiné à s'affranchir des effets perturbateurs de l'atmosphère terrestre et des sources de bruits. La description spectro-morphologique obtenue doit permettre d'appréhender les diverses caractéristiques spatiales et d'évaluer simultanément les comportements spectraux sur une bande étendue de fréquences. Cette approche, bénéficiant d'une caractérisation plus complète que les études précédentes, pourra alors servir de base au développement de nouveaux schémas de classification spectro-morphologique des galaxies.
La méthodologie retenue cherche à tirer le meilleur parti des techniques de modélisation paramétrique (permettant de simuler l'apparence des galaxies) et non paramétrique (reposant sur un traitement direct de l'observation). D'une part, les méthodes de modélisation paramétrique fournissent une description de haut niveau sémantique de l'objet, donnant accès à une interprétation plus aisée des résultats en termes astronomiques. D'autre part, les techniques de modélisation non paramétrique basées sur la morphologie mathématique offrent un outil puissant permettant de gérer avec précision et robustesse les étapes de pré- et post-traitements ainsi que la mise en place de filtres adaptatifs intégrés au modèle paramétrique.
Approche statistique
L'essentiel de la caractérisation spectro-morphologique de la galaxie est réalisée par inversion d'un modèle paramétrique. Ce modèle, qui permet de simuler une observation de galaxie à partir des paramètres de ses différentes structures, consiste en une extension des modèles préexistants au cadre multispectral et à l'ajout de nouvelles structures astrophysiques. Une originalité de notre modèle est d'incorporer un filtre sur l'observation, dont les paramètres sont estimés, et qui a pour but de masquer de manière adaptative les zones de formation stellaire, peuplées de jeunes et massives étoiles brillant fortement dans des longueurs d'ondes courtes et de perturber l'estimation des autres paramètres du modèle. Dans ce modèle, l'ensemble des paramètres sont dits de haut niveau sémantique et peuvent recevoir une interprétation directe de l'astronome en termes physiques ou observationnels.
L'inversion du modèle est réalisée dans un cadre bayésien, permettant de tenir compte des incertitudes et de fournir une solution régularisée. Le calcul de l'estimateur retenu, le Maximum a Posteriori, est un problème complexe car le paysage énergétique de l'espace des solutions est peuplé de nombreux maxima locaux fortement prononcés. Afin de fournir une solution robuste, les algorithmes d'estimation adoptés sont basés sur des techniques de Monte Carlo par chaines de Markov associées à une nouvelle approche de recuit simulé utilisant plusieurs températures différentes pour répartir l'effort de simulation de manière optimale. Finalement, un schéma de décomposition hiérarchique a été mis en ÷uvre. Ce dernier repose sur une hiérarchie de modèles de plus en plus fins (comportant de plus en plus de structures), l'estimation d'un modèle grossier servant alors à initialiser l'estimation du modèle plus complexe. Nous avons montré que cette approche offre un gain de rapidité, d'exécution et de robustesse.
Approche morphologique
Dans un deuxième temps, l'analyse des images par le biais de méthodes morphologiques permet le développement d'algorithmes eficaces pour les pré- et post-traitements des images : séparation des sources, extraction de structures comme les bras spiraux, détection des zones de formation stellaire. L'ensemble de ces algorithmes s'appuie sur une représentation hiérarchique de l'image dite d'analyse en arbre de composantes connexes. La définition des arbres de composantes connexes est étendue à la théorie des hyperconnexions qui permet de décomposer une image en composantes dites hyper-connexes sur la base de relations spatiales et de niveaux de gris. Cette approche offre une meilleure gestion des images contenant des objets diffus et fortement bruités. Les travaux menés donnent non seulement une définition de la notion d'arbre de composantes hyperconnexes et des conditions nécessaires à sa réalisation mais font également évoluer la théorie des hyperconnexions.Ces développements ont permis de mettre en avant une sous-classe d'hyperconnexions dites accessibles qui ont la propriété de générer des décompositions nécessaires et sufisantes. Cette condition d'accessibilité est formulée suivant différents points de vues équivalents et permet de simplifier les opérateurs de la théorie et d'offrir une base solide pour les opérations de filtrage et de détection.
Cette nouvelle définition permet le développement d'algorithmes eficaces et robustes pour le traitement et l'analyse d'images en général et pour l'imagerie astronomique multivariée en particulier. Les arbres de composantes hyperconnexes pour une hyperconnexion particulière (dite floue) et leur utilisation dans un cadre multivalué sont étudiés. L'impact du choix des propriétés de l'ordre vectoriel utilisé pour construire l'arbre est notamment exploré en détails.
Conclusion
Les méthodes développées sont appliquées à un jeu de données réelles de plusieurs milliers d'images extrait de la base EFIGI (Extraction de Formes Idéalisées de Galaxies en Imagerie) fournie par l'Institut d'Astrophysique de Paris. La comparaison des résultats obtenus avec les annotations des experts permettent de valider le bon comportement de nos algorithmes.
Ces travaux ont donné lieu à la publication 2 de : deux articles dans des revues internationales à comité de lecture (TIP 2011, PR 2010), un chapitre de livre en anglais (Multivariate Image Processing), trois articles de conférences internationales à comité de lecture (ISMM 2011, ICPR 2010, SCIA 2009) un workshop international à comité de lecture (WADGMM 2010) et un article de conférence nationale à comité de lecture (GRETSI 2009).