Terapix Star Formation Region IC 1396, © 2002 CFHT
Data decomposition using PCA / Décomposition des données par ACP
by - Updated June 13th, 2005
First results of decomposition of galaxies using Principal Components Analysis.
Premiers résultats de décomposition d'images de galaxies par Analyse en Composantes Principales.

The set of data used was provided in this article. Images are pretreated as indicated below :

-  Rotation computed according to second order moments. Second order moments permit to determine a galaxy global direction and to align it on a given axis, here, the horizontal axis.
-  Scaling computed according to second order moments. As for the rotation, the size of the galaxy is computed and the whole set of images is homogenized.
-  Resizing to images of 129x129 pixels.
-  Data centering and reduction. Pixels mean is substracted and the image is normalized by its variance.

Images obtained this way are used for PCA. Below, the example of a galaxy treated as indicated. One can notice that the main axis is horizontal and that the galaxy was rebinned.

Source image / Vignette originale - 9.7 kb
Source image / Vignette originale

Pretreated image / Vignette prétraitée - 5 kb
Pretreated image / Vignette prétraitée

PCA is computed on a small set of data as we have only 131 images. The decomposition gives a basis containing 131 images on which one can see effet of noise and particularly of parasite stars found on many images. The KL basis is available in FITS-MEF :

KL Basis obtained from PCA / Base de KL obtenue par ACP - 7.7 Mb
KL Basis obtained from PCA / Base de KL obtenue par ACP
(GZ, 7.7 Mb)

Here is the example galaxy rebuilt with 32 components among 131. The whole set of pretreated and rebuilt images is also available.

Reconstructed image / Vignette reconstruite - 6 kb
Reconstructed image / Vignette reconstruite
32 components / 32 composantes

Pretreated and rebuilt images / Images prétraitées et reconstruites - 13.5 Mb
Pretreated and rebuilt images / Images prétraitées et reconstruites
(GZ, 13.5 Mb)

Conclusion: Results of the decomposition clearly show that parasite stars on images of galaxies disturb the PCA that explores direction irrelevant for the morphological analysis. Some principal components not so important (50th or higher) contain interesting spiral structures whereas the few first components contain informations on the edge to represent stars uninteresting for the project.

Removing these stars must be a pretreatment step. The removal is the next job to achieve.


Le jeu de données utilisé est fourni dans cet article. Les images subissent le prétraitement suivant :

-  Rotation calculée à partir des moments du second ordre. Les moments du second ordre permettent de déterminer la direction globale de la galaxie et de l'aligner selon un axe défini, en l'occurence, l'axe horizontal.
-  Redimensionnement calculé à partir des moments du second ordre. De la même facon, la taille de la galaxie est calculée puis l'ensemble des images est homogénéisé.
-  Recadrage des images en vignettes de 129x129 pixels.
-  Centrage et réduction des données. La moyenne des pixels est soustraite puis l'image est normée en variance.

Les images ainsi obtenues sont utilisées pour l'ACP. Ci-dessous, l'exemple d'une galaxie ayant subie les opérations indiquées. On constate que son grand axe est horizontal et qu'elle a été redimensionnée.

Source image / Vignette originale - 9.7 kb
Source image / Vignette originale

Pretreated image / Vignette prétraitée - 5 kb
Pretreated image / Vignette prétraitée

L'ACP est effectuée sur un jeu de données faible puisqu'on ne dispose que de 131 vignettes. La décomposition donne une base de 131 images sur laquelle on constate nettement l'influence du bruit et notamment des étoiles parasites qui se trouvent sur de nombreuses images. La base de KL est disponible au format FITS-MEF :

KL Basis obtained from PCA / Base de KL obtenue par ACP - 7.7 Mb
KL Basis obtained from PCA / Base de KL obtenue par ACP
(GZ, 7.7 Mb)

Ci-dessous, la galaxie d'exemple reconstruite avec 32 composantes sur 131. La totalité des images prétraitées et reconstruites est également disponible.

Reconstructed image / Vignette reconstruite - 6 kb
Reconstructed image / Vignette reconstruite
32 components / 32 composantes

Pretreated and rebuilt images / Images prétraitées et reconstruites - 13.5 Mb
Pretreated and rebuilt images / Images prétraitées et reconstruites
(GZ, 13.5 Mb)

Conclusion : Les résultats de la décomposition montrent clairement que les étoiles parasitant les images de galaxies perturbent l'ACP qui explorent des directions qui ne sont pas pertinentes pour l'analyse morphologique. Des composantes principales de faible importance (50ème ou plus) contiennent des structures spiralées qui sont intéressantes alors que les premières composantes contiennent des informations en bordure d'images pour représenter les étoiles sans intérêt pour le projet.

Un nettoyage de ces étoiles s'impose comme une étape de prétraitement des images. Ce nettoyage constitue le prochain travail à mener.


Site Map  -   -  Contact
© Terapix 2003-2011