---
title: Analyse de données
tags: ANDO, pierre.gastanaga
---
# Analyse de données
2 parties:
I) Description bi-dimensionnelle et mesure de corrélation
- Lois conjointe de (X,Y)
- Lois marginales
- Lois conditionelles
- Covariance de (N(X,Y)) et corrélation
II) Description multidimensionnelle
- Tableau des données
- Matrice de poids
- Matrice des données centrées
- Matrice de var_cov
- Matrice de corrélation
- Algo A.C.P. (Analyse Composantes Principales)
## I) Description bidimensionelle
### 1) Lois des couples (X,Y)
Soient X et Y 2 variables aléatoires discrètes définies sur le même espace probabilisé: ($\varOmega$, $\mathscr{C, P}$)
$X(\Omega)=\left\{x_{i} | i \in I\right\}$
$X(\Omega)=\left\{x_{i=j} | j \in J\right\}$
:::info
On appelle loi conjointe du couple (X,Y) l'ensemble des couples $((x_i, y_j), P_{ij})$ où $x_i \in X(\Omega),\ y_i \in Y(\Omega)$
:::
$P_{i, j}=P\left(\left(x=x_{i}\right) \cap\left(y=y_{j}\right)\right)$
Remarque: Si I = $[[1, r]]$ et J = $[[1,s]]$
$\begin{array}{c|ccc}
{X/Y} & {y_{1}} & {\dots} & {y_{j}} & {\dots} & {y_s} \\
\hline {x} & {} & {} & {\vdots} & {} \\
{\vdots} & {} & {} & {\vdots} & {} \\
{x_i} & {\dots} & {\dots} & {\left(P_{ij}\right)} & {\dots} & {\dots} \\
{\vdots} & {} & {} & {\vdots} & {} & {} \\
{x_r} & {} & {} & {\vdots} & {} & {} \\
\hline
\end{array}$
### 2) Lois marginales
:::info
Les variables X et Y sont appelées variables marginales
$P\left(X=x_{1}\right)=\sum_{j \in J} P_{i j}=\sum P\left(\left(x=x_{i}\right) \cap\left(y=y_{i}\right)\right)$
$P\left(X=x_{i}\right)=P_{i.} \quad P\left(Y=y_{j}\right)=\sum_{i \in I} P_{ij}=P_{. j}$
:::
Exemple:
$\begin{array}{c|cccc|c}
X/Y & {1} & {2} & {3} & {4} & {P_{i.}} \\
\hline 1 & {1\over16} & {1\over16} & {1\over16} & {1\over16} & {1\over4} \\
2 & {0} & {2\over16} & {1\over16} & {1\over16} & {1\over4} \\
3 & {0} & {0} & {3\over16} & {1\over16} & {1\over4} \\
4 & {0} & {0} & {0} & {4\over16} & {1\over4} \\
\hline P_{.j} & 1\over16 & 3\over16 & 5\over16 & 7\over16 & 1
\end{array}$
### 3) Lois Conditionelles
:::info
**Définition**: On appelle lois conditionelles de $X=x_i$ sachant que $Y=y_j
$P\left(X=x_{i} / Y=y_{j}\right)=\frac{P\left(\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right)}{P\left(Y=y_{j}\right)}=\frac{P_{ij}}{p_{.j}}$
$P\left(Y=y_{j} / X=x_{i}\right)=\frac{P_{ij}}{p_{i.}}$
:::
**Indépendance**: X et Y sont indépendants ssi $P((X=x)\cap(Y=y))=P(X=x)* P(Y=y)$
$\Leftrightarrow P_{i, j}=P_{i.} \times P_{.j}, \quad \forall i, j \in I \times J$
$\Leftrightarrow P(X=x / Y=y) = P(X=x)$
### 4) Loi d'une fonction ded 2 variables
Soit $g:\mathbb R^2 \rightarrow \mathbb R$ définie sur l'ensemble des valeurs prises par X et Y
$Z = g(X, Y)$
$\left(Z=z_{k}\right)=\bigcup_{(i, j)}\left(\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right)$
$g(x_i, y_j) = z_k$
:::info
$P\left(Z=z_{k}\right)=\sum_{(i, j)} P\left(\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right)$
$g(x_i, y_j) = z_k$
:::