Présents: S.Arnouts, A.Baillard, E.Bertin, P.Fouqué, T.Géraud, M.Lienou, H.Maitre, J.-C.Mauduit, H.J.McCracken, V.de Lapparent, Y.Mellier, R.Pelló, P.Prugniel, O.Ricou, L.Tasca
Cette réunion synthétise les avancées faites à mi-parcours, et entend faire le point sur le contexte scientifique de l'usage des mesures morphologiques afin d'orienter le choix final des techniques d'analyse.
Présentations (matin)
Emmanuel Bertin fait un bilan des progrès réalisés dans les mois écoulés: mise à l'épreuve des shapelettes, étage de prétraitement et décomposition initiale, application/comparaison SVM/MLP, constitution des échantillons de galaxies bien résolues en visible (PGC-1.3, plusieurs teraoctets d'images téléchargés, traités et controlés), Ultra-Violet (GalEx), sélection des attributs, la mise en service du système d'étiquetage manuel. Sont en retard la gestion de la réponse impulsionnelle, la disponibilité d'un grand échantillon (étiqueté avec tous les attributs) de galaxies résolues et de galaxies faibles (avec des informations morphologiques), et les simulations d'images (seconde mise-à -jour de SkyMaker). Anthony Baillard a démarré en décembre sa thèse sous la co-supervision d'Albert Bijaoui et d'Emmanuel. Une machine spécifiquement EFIGI a été achetée à TERAPIX pour héberger la première version du classifieur en ligne.
Emmanuel Bertin présente l'échantillon PGC-1.3 nouvellement mis à disposition au sein de la collaboration, et le mini-pipeline qui a permis de le construire. Les images des 4462 galaxies, recentrées et mises à l'échelle, sont issues de la version 4 du relevé SDSS, et sont disponibles en 5 bandes allant du proche UV au très-proche IR. La sélection initiale des galaxies, effectuée avec le concours de Pascal, s'est faite sur le critère d'existence d'un type morphologique T assorti d'une incertitude dans le catalogue PGC, garantie d'une classification pertinente. Les données sont-elles correctement échantillonnées (Henri)? Pour une majorité de galaxies oui, seules les galaxies de plus de 3' environ sont sous-échantillonnées.
Anthony Baillard fait le point sur la version actuelle du classificateur, et présente une démonstration de l'outil ManClass destiné à l'étiquetage en ligne des images de galaxies, en particulier celles de l'échantillon PGC-1.3. ManClass est couplé à une base de données, et les réponses sur les 18+1 attributs qu'il gère peuvent être comparés entre classifieurs humains et mais aussi avec celles des classifieurs artificiels. Les résultats préliminaires de l'application du classifieur SVM à quelques attributs de l'échantillon PGC-1.3 sont encourageants; Henri insiste sur le fait que la précision du centrage semble actuellement limiter les performances de la PCA. Le problème de la détermination de la taille optimale des noyaux de reprojection du SVM est mentionné.
Emmanuel Bertin présente quelques statistiques intra- et inter-personnelles faites par ManClass sur les premiers étiquetages d'attibuts. Dans l'ensemble les corrélations retrouvées n'apportent pas de grande surprise; à noter une corrélation positive observée entre indices de présence d'anneaux interne et externe. Comme attendu, des corrélations significatives entre divers attributs et l'angle d'inclinaison de la galaxie sont observées; elles sont très variables d'un individu à l'autre; le travail d'homogénéïsation statistique devra prendre cela en compte. La concordance entre la classification des astronomes EFIGI et celle du catalogue PGC est remarquablement meilleure que celle observée avec les versions précédentes de ManClass et de l'échantillon PGC: environ 1 type rms; ce qui montre l'impact du travail de présention des images (couleurs) et d'apprentissage sur l'interface. Quelques tests conduits avec un MLP sur les différents attributs dans la base préliminaire de ManClass semblent indiquer que la connaissance d'autres attributs que le rapport d'intensité bulbe/total n'apporte pas de gain significatif à la précision de classification du type de Hubble. Henri pose la question des temps d'apprentissage et de burn-in des classifieurs humains. L'expérience montre qu'il faut en moyenne environ 3 minutes pour étiqueter complétement une galaxie. Le burn-in (durée nécessaire pour obtenir une réponse stable des classifieurs) semble lui être proche de ou supérieur à une centaine de galaxies. La discussion s'oriente ensuite sur les différents biais susceptibles d'affecter l'étiquetage. Philippe discute les principaux biais sur la visibilité des attributs, causés par l'inclinaison de la galaxie. Henri met en garde contre le phénomène de Mach en cas de changements de pente des profils de lumière, qui peuvent suggérer à tort la présence d'un anneau.
Lidia Tasca expose ses travaux sur l'évolution morphologique des galaxies, conduits à partir à la fois d'ajustements des profils de lumière (logiciel GIM2D) et de mesures non-paramètriques (asymétrie,concentration). 40000 heures de calcul ont été obtenues au CINES pour les mesures sur des données du télescope spatial. La méthode de l'ajustement a ses avantages (précision, prise en compte de la PSF, reproductibilité) mais aussi ses limitations (bras spiraux et autres attributs réduits à l'état de contaminants), auxquelles EFIGI doit pallier.
Mélanie Groisne discute des avantages que les beamlets peuvent offrir pour l'analyse multi-échelle des structures dans les images de galaxies. L'extraction et la reconstruction de structures filamentaires est possible au moyen d'une décomposition en arbre.
Philippe Prugniel montre le rôle que peut jouer HyperLeda dans les opérations de classification des galaxies. HyperLeda contient les paramètres observés de 4 millions de galaxies "proches", dont certaines informations morphologiques pour une fraction d'entre-elles. Le projet de catalogue RC4, prévu pour fin 2008, met l'accent sur les masses, les distances, mais aussi la morphologie, et implique un gros travail de croisement de différents jeux de données. Les difficultés pour homogénéïser le contenu d'un tel catalogue sont soulignées par Pascal.
Roser Pelló discute de la comparaison entre types spectroscopiques (définis à partir de l'allure des spectres des objets) et types morphologiques des galaxies dans le contexte de leur évolution. Les techniques de type photo-z basées sur l'ajustement de modèles spectraux à des mesures photométriques multi-canal fournissent à la fois une estimation du décalage spectral (à 10% près) et le type spectral le plus probable pour de vastes quantités de galaxies faibles. La confrontation des types morphologiques et spectroscopiques permet notamment de suivre l'évolution des galaxies de type précoce (qui "bleuissent" en remontant dans le temps). Les mesures des différents attributs morphologiques trahissent à des degrés divers les phénomènes de coalescence (le principal facteur d'évolution rapide des galaxies), et complémentent ainsi parfaitement les informations apportées par les mesures spectrales sur la formation stellaire et la composition chimique .
Valérie de Lapparent présente son travail sur les fonctions de luminosité des galaxies par type. Le type spectroscopique permet de séparer types précoces et tardifs, mais ne permet pas de séparer les naines des galaxies plus brillantes (naines sphéroïdales dE/dS0 des E et naines irrégulières dI des spirales), dont les natures sont pourtant différentes. Les informations morphologiques sont indispensables pour identifier les naines (profil exponentiel pour les type spectraux précoces, faible brillance de surface et absence de structure bien définie pour les types spectraux avancés).
Discussion et Décisions La discussion porte sur l'identification des naines sphéroïdales et irrégulieres. Il est recommandé d'ajouter dans ManClass une case pour les dE/dS0, et de supprimer les type I0 (qui, selon Pascal correspondent essentiellement à des S0 perturbées). Les sous-échantillons PGC-1.3 pour étiquetage manuel sont distribués comme suit:
1 Yannick Mellier
2 Henry Joy McCracken
3 Emmanuel Bertin
4 Pascal Fouqué
5 Roser Pelló
6 Valérie de Lapparent
7 Philippe Prugniel
8 Stéphane Arnouts
9 Jean-François le Borgne
Une date limite indicative de fin-septembre est fixée pour la classification de l'ensemble des objets.
Les différentes présentations ont mis en avant la nécessité de mettre en place une approche hybride de mesure morphologique, incluant à la fois ajustement de profil (corrigé des effets de la réponse impulsionnelle) et identification de structures spécifiques. Philippe insiste sur la nécessité de bien distinguer type de de Vaucouleurs et type photométrique. A ce titre, il recommande de n'ajuster que des composantes de profil concentriques et sans twist des isophotes. Des images de simulation seront nécessaires pour valider la routine d'ajustement de profil et quantifier les effets de pollution par des structures telles que les bras spiraux; Emmanuel doit poursuivre rapidement le développement de SkyMaker (parallélisation, ajout des composantes barres, structure spirale et bandes de poussière), avec une première mise-à -jour à la rentrée, puis une finalisation durant le quatrième trimestre 2006. De leur coté, Anthony et Lidia coopérent sur l'analyse de l'échantillon de galaxies pour lequel Lidia dispose d'ajustements GIM2D. Après le départ de Stéphane pour Hawaii, Lidia devient le point de contact principal à l'OAMP. Stéphane se charge lui de transmettre les images UV de galaxies résolues de la seconde release GalEx.