--- title: Analyse de données tags: ANDO, pierre.gastanaga --- # Analyse de données 2 parties: I) Description bi-dimensionnelle et mesure de corrélation - Lois conjointe de (X,Y) - Lois marginales - Lois conditionelles - Covariance de (N(X,Y)) et corrélation II) Description multidimensionnelle - Tableau des données - Matrice de poids - Matrice des données centrées - Matrice de var_cov - Matrice de corrélation - Algo A.C.P. (Analyse Composantes Principales) ## I) Description bidimensionelle ### 1) Lois des couples (X,Y) Soient X et Y 2 variables aléatoires discrètes définies sur le même espace probabilisé: ($\varOmega$, $\mathscr{C, P}$) $X(\Omega)=\left\{x_{i} | i \in I\right\}$ $X(\Omega)=\left\{x_{i=j} | j \in J\right\}$ :::info On appelle loi conjointe du couple (X,Y) l'ensemble des couples $((x_i, y_j), P_{ij})$ où $x_i \in X(\Omega),\ y_i \in Y(\Omega)$ ::: $P_{i, j}=P\left(\left(x=x_{i}\right) \cap\left(y=y_{j}\right)\right)$ Remarque: Si I = $[[1, r]]$ et J = $[[1,s]]$ $\begin{array}{c|ccc} {X/Y} & {y_{1}} & {\dots} & {y_{j}} & {\dots} & {y_s} \\ \hline {x} & {} & {} & {\vdots} & {} \\ {\vdots} & {} & {} & {\vdots} & {} \\ {x_i} & {\dots} & {\dots} & {\left(P_{ij}\right)} & {\dots} & {\dots} \\ {\vdots} & {} & {} & {\vdots} & {} & {} \\ {x_r} & {} & {} & {\vdots} & {} & {} \\ \hline \end{array}$ ### 2) Lois marginales :::info Les variables X et Y sont appelées variables marginales $P\left(X=x_{1}\right)=\sum_{j \in J} P_{i j}=\sum P\left(\left(x=x_{i}\right) \cap\left(y=y_{i}\right)\right)$ $P\left(X=x_{i}\right)=P_{i.} \quad P\left(Y=y_{j}\right)=\sum_{i \in I} P_{ij}=P_{. j}$ ::: Exemple: $\begin{array}{c|cccc|c} X/Y & {1} & {2} & {3} & {4} & {P_{i.}} \\ \hline 1 & {1\over16} & {1\over16} & {1\over16} & {1\over16} & {1\over4} \\ 2 & {0} & {2\over16} & {1\over16} & {1\over16} & {1\over4} \\ 3 & {0} & {0} & {3\over16} & {1\over16} & {1\over4} \\ 4 & {0} & {0} & {0} & {4\over16} & {1\over4} \\ \hline P_{.j} & 1\over16 & 3\over16 & 5\over16 & 7\over16 & 1 \end{array}$ ### 3) Lois Conditionelles :::info **Définition**: On appelle lois conditionelles de $X=x_i$ sachant que $Y=y_j $P\left(X=x_{i} / Y=y_{j}\right)=\frac{P\left(\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right)}{P\left(Y=y_{j}\right)}=\frac{P_{ij}}{p_{.j}}$ $P\left(Y=y_{j} / X=x_{i}\right)=\frac{P_{ij}}{p_{i.}}$ ::: **Indépendance**: X et Y sont indépendants ssi $P((X=x)\cap(Y=y))=P(X=x)* P(Y=y)$ $\Leftrightarrow P_{i, j}=P_{i.} \times P_{.j}, \quad \forall i, j \in I \times J$ $\Leftrightarrow P(X=x / Y=y) = P(X=x)$ ### 4) Loi d'une fonction ded 2 variables Soit $g:\mathbb R^2 \rightarrow \mathbb R$ définie sur l'ensemble des valeurs prises par X et Y $Z = g(X, Y)$ $\left(Z=z_{k}\right)=\bigcup_{(i, j)}\left(\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right)$ $g(x_i, y_j) = z_k$ :::info $P\left(Z=z_{k}\right)=\sum_{(i, j)} P\left(\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right)$ $g(x_i, y_j) = z_k$ :::