Les observations de variables sur individus sont regroupes en une matrice a ligned et colonnes
est la valeur prise par la variable sur le ieme individu.
On associe a chaque indvidu un poids (probabilite de choisir l'individu)
Si ou matrice identite
La vecteur des moyennes arithmetiques de chaque variable est definie par
Le tableau des donnees centrees et la matrice Y telle que
Definition:
On appelle matrice de variance-covariance:
:::
Si on note la matrice diagonale des inverses des ecarts-types:
ou:
On appelle la matrice des donnees centrees et reduite: telle que:
Matriciellement:
La matrice regroupant les coefficients de correlation lineaire entre les variables est :
Ou: : covariance
Remarque:
Chaque individu etant un vecteur defini par coordonnees est considere comme un element d'un espace vectoriel appele l'espace des individus.
Les individus forment alors un nuage de points dans et en est le barycentre (ou centre de gravite).
On munit l'espace d'une metrique (distance):
ou: est une matrice symetrique et definie positive (S.D.P)
Remarque: si (matrice identite), on se retrouve avec le produit scalaire usuel.
Si cela revient a diviser chaque caractere par son ecart-type.
Definition:
On appelle inertie totale du nuage de points la moyenne ponderee des carres des distances des points au centre de gravite:
On peut montrer que l'inertie du nuage est egale a la trace de la matrice :
On note : l'espace des variables
On munit de la metrique avec D la matrice des poids
Si les variables sont centrees:
La norme de (variable centree)
On mesure l'angle entre 2 variables et (centrees):
On retrouve le coefficient de correlation lineaire.
une variable , on peut associer un axe de l'espace des individus et un vecteur de l'espace des variable et on peut egalement deduire de nouvelles variables par combinaison lineaire.
Soit un axe de . est engendre par un vecteur unitaire et projetons les individus sur (projection -orthogonale)
La liste des coordonnees des individus sur forme une nouvelle variable artificielle
On pose : facteur
Donc la nouvelle variable est une combinaison lineaire des variables initiales.
L'ensemble des variables que l'on peut engendrer par combinaison lineaire des vecteurs colonnes de forme un sous-espace vectoriel (s.e.v.) de de dimension
Remarque: Si
On suppose que les variables sont centrees () pour simplifier
Proposition:
:::
Demonstration:
Le but de la methode est d'obtenir une representation approchee du nuage des individus dans un s.e.v de dimension faible.
Ceci s'effectue par projection
Il faut deformer le moins possible les distances en projection, ce qui signifie que l'inertie du nuage projete sur le s.e.v. soit maximale.
Soit : la projetction -orthogonale sur le s.e.v.
Le nuage projete est associe au tableau: car:
On determine la matrice de var-covariance du tableau :
On determine l'inertie du nuage projete:
Donc l'inertie du nuage projete est
Le probleme est donc de trouver : projection orthogonale de rang maximisant la trace de , ce qui determinera ()
Theoreme:
Soit un s.e.v. portant l'inertie maximale, alors le s.e.v. de dimension portant l'inertie maximale est la somme directe de et du s.e.v. de dimension 1 -orthognal a portant l'inertie maximale.
:::
Pour obtenir on pourra proceder de proche en proche en cherchant d'abord le s.e.v. de dimension d'inertie maximale puis le s.e.v. de dimension orthogonal au premier d'inertie maximale.
On chercher la droite de passant par , maximisant l'inertie du nuage projete sur cette droite, On rappelle la projection -orthogonale sur la droite dirigee par :
Inertie du nuage projete sur cette droite:
Si est symetrique:
Donc est un vecteur propre de associe a (valeur propre).
Il faut que soit maximale.
Donc le s.e.v. de dimension est engendre par les vecteurs propres de $VM associes aux plus grandes valeurs propres.
On appelle composantes principales:
:::
Si les variables initiales sont centrees alors
Le put de l'A.C.P. etant d'obtenir une representation des individus dans un espace de dimension plus faible que .
Le critere le plus utilise est celui du pourcentage d'inertie totale expliquee on mesure la qualite de par:
Inertie totale:
Si par exemple , on concoit qu'une representation du nuage dans le plan des 2 premiers axes principaux sera tres satisfaisante.
La methode la plus naturelle pour donner une signification a une composante principale est de la relier aux variables (variables intiales) en calculant les coefficients de correlation lineaire
et en s'interessant aux plus forts coefficients en valeur absolue