# ASE 3 : Couple de variables aleatoires discretes et analyse des donnees
# Couple de variables aleatoires reelles et discretes
Soient $X$ et $Y$ 2 v.a reelles discretes.
:::info
On appelle couple $(X,Y)$ l'application de $\Omega\to\mathbb R^2$ definie par $(X,Y)(\omega)=(X(\omega), Y(\omega))$
:::
$X$ et $Y$ sont definis sur un meme espace probabilite ($$\underbrace{\Omega}_{\text{univers}}, \underbrace{\mathcal C}_{\text{tribu}}, \underbrace{P}_{\text{probabilite}}$$)
## La loi d'un couple $(X,Y)$ (Loi conjointe)
:::info
**Definition**
On appelle loi de $(X,Y)$ l'ensemble des couples $((x_i,y_j), P_{i,j})$ ou
- $x_i\in X(\Omega)$ l'ensemble des valeurs de $X$
- $y_j\in Y(\Omega)$ l'ensemble des valeurs de $Y$
:::danger
$$
P_{ij} = \mathbb P((X=x_i)\cap(Y=y_j))
$$
:::
:::
Si $I = [[1, r]]$ et $J = [[1,s]]$ (ensemble discret, ensemble des indices). Les $P_{i,j}$ sont souvent donnes dans le tableau a double entres.
|$X /Y$|$y_1$|$\dots$|$y_j$|$\dots$|$y_s$|
|-|-|-|-|-|-|
|$X_1$|$P_{1,1}$|$\dots$|$P_{1,j}$|\dots|$P_{1,s}$|
|$\vdots$|$\vdots$||$\vdots$||$\vdots$|
|$X_i$|$P_{i,1}$|$\dots$|$P_{i,j}$|$\dots$|$P_{1,s}$|
|$\vdots$|$\vdots$||$\vdots$||$\vdots$|
|$X_r$|$P_{r,1}$|$\dots$|$P_{r,j}$|$\dots$|$P_{r,j}$|
:::danger
$$
P_{i,j} \gt 0 \quad\text{et}\quad\sum_{i\in I\\ j\in J}P_{ij} = 1
$$
:::
## Lois marginales
:::info
**Definition**
Les v.a $X$ et $Y$ sont appeles variables marginales du couple $(X,Y)$. La loi de $X$ (resp. de $Y$) est appelee loi marginale de $X$ (resp. de $Y$)
:::
**Notation**:
$$
\forall i\in I, \mathcal P(X=x_i)=P_{i\circ} \text{ et } \mathcal P(X=y_j)=P_{\circ j} \\
P_{i\circ} = \mathcal P(X=x_i) = \sum_{j\in J}\mathcal P((X=x_i)\cap(Y=y_j)) = \sum_{j\in J}P_{ij}\\
\forall j\in J\quad P_{\circ j}=\sum_{i\in I}\mathcal P((X=x_i)\cap(Y=y_j)) = \sum_{i\in I}P_{ij}
$$
### Exemple
$(X,Y)$ un couple de v.a. dont la loi conjointe est donnee par le tableau:
| $X / Y$ | 1 | 2 | 3 | 4 |$P_{i\circ}$ (Loi marginale de $X$)|
| - | - | - |-|-|-|
| 1 |$\frac{1}{16}$| $\frac{1}{16}$ | $\frac{1}{16}$ | $\frac{1}{16}$|$\frac{1}{4}$|
| 2 | 0 | $\frac{2}{16}$ |$\frac{1}{16}$| $\frac{1}{16}$ |$\frac{1}{4}$|
| 3 | 0 | 0 | $\frac{3}{16}$ | $\frac{1}{16}$ |$\frac{1}{4}$|
| 4 | 0 | 0 | 0| $\frac{4}{16}$ |$\frac{1}{4}$|
| $P_{\circ j}$ (Loi marginale de $Y$) | $\frac{1}{16}$ | $\frac{3}{16}$ |$\frac{5}{16}$ | $\frac{7}{16}$|1|
## Loi conditionnelles
:::info
**Definition**
Soit $X$ un v.a reelle sur $(\Omega, \mathcal C, P)$
$$
X(\Omega) = \{x_i\vert i\in I\}, \text{soit } A\text{ un evenement }/P(A)\neq 0
$$
La loi conditionnelle de $X$ sachant $A = \{(x_i, P_A(X=x_i)), i\in I\}$
:::danger
$$
P_A(X=x_i) = \frac{P((X=x_i)\cap A)}{P(A)}
$$
:::
:::
En particulier, $A$: <<$Y=y_i$>>
$$
P_{(Y=y_i)}(X=x_i)=\frac{P((X=x_i)\cap(Y=y_i))}{P(Y=y_j)}=\frac{P_{i,j}}{P_{\circ j}}
$$
:::success
$$
P_{(Y=y_j)}(X=x_i) = \frac{P_{i,j}}{P_{\circ j}}
$$
:::
### Exemple
On reprend l'exemple precedent
|$X_i$|1|2|3|4|
|-|-|-|-|-|
|$P_{(Y=3)}(X=x_i)$|$\frac{1}{5}$|$\frac{1}{5}$|$\frac{3}{5}$|$0$|
$$
P_{(Y=3)}(X=1)=\frac{P((X=1)\cap(Y=3))}{P(Y=3)}=\frac{\frac{1}{16}}{\frac{5}{16}} = \frac{1}{5}
$$
### Independantes
:::info
**Definition**
$X$ et $Y$ sont 2 v.a. independantes ssi
:::danger
$$
P((X=x)\cap(Y=y)) = P(X=x)P(Y=y)\quad]forall x\in X(\omega), \forall y\in Y(\omega)\\
\Leftrightarrow P_{ij} = P_{i\circ} \circ P_{\circ j}
$$
:::
:::
Soit g une fonction de $\mathbb R^2\to\mathbb R$, definie sur l'ensemble des valeurs prises par $(X,Y)$
Soit $Z=g(X,Y)$, $Z_h=g(x_i,y_j)\in Z(\Omega)$
$$
(Z=Z_k) = \cup_{(i,j) \\ Z_k = g(x_i,y_j)}((X=x_i)\cap(Y=y_j))\Rightarrow\color{red}{\mathcal P(Z=Z_k)=\sum_{(i,j) \\ Z_k = g(x_i,y_j)}P((X=x_i)\cap(Y=y_i))}
$$
En particulier $Z=X+Y=g(X,Y)$
$$
P(Z=z) = \sum_{(x,y) \\ x+y=z}\mathcal P((X=x)\cap(Y=y))
$$
Si $Z=X.Y=g(X,Y)$
$$
P(X.Y=z) = \sum_{(x,y) \\ x.y=z}\mathcal P((X=x)\cap(Y=y))
$$
### Exemple
$(X,Y)$ couple defini par
|$X / Y$|1|2|3|4|
|-|-|-|-|-|
|1|$\frac{1}{16}$|$\frac{1}{16}$|$\frac{1}{16}$|$\frac{1}{16}$|
|2|0|$\frac{2}{16}$|$\frac{1}{16}$|$\frac{1}{16}$|
|3|0|0|$\frac{3}{16}$|$\frac{1}{16}$|
|4|0|0|0|$\frac{4}{16}$|
Determiner la loi de $Z=X+Y$
$Z=\{2,3,4,5,6,7,8\}$
|$Z_k$ |2|3|4|5|6|7|8|
|- |-|-|-|-|-|-|-|
|$P(Z=Z_k)$| | | | | | | |
$$
\begin{aligned}
P(Z=5) &= P(X+Y=5)\\
&= P((X=1)\cap(Y=4)) P((X=2)\cap(Y=3)) + P((X=3)\cap(Y=3)) + P((X=4)\cap(Y=1))\\
&= \frac{1}{16} + \frac{1}{16} + 0 + 0 =\frac{2}{16} = \frac{1}{8}
\end{aligned}
$$
Determiner la loi de $Z=X.Y$
$Z(\Omega)$ = \{1,2,3,4,6,8,9,12,16\}
|$Z_k$|1|2|3|4|6|8|9|12|16|
|-----|-|-|-|-|-|-|-|--|--|
|$P(Z=Z_k)$|$\frac{1}{16}$|$\frac{1}{16}$|$\frac{1}{16}$|$\frac{3}{16}$|$\frac{1}{16}$|$\frac{1}{16}$|$\frac{3}{16}$|$\frac{1}{16}$|$\frac{4}{16}$|
$$
\begin{aligned}
P(Z=4) &= P((X=1)\cap(Y=4)) + P((X=2)\cap(Y=2)) + P((X=4)\cap(Y=1))\\
&= \frac{1}{16} + \frac{2}{16} + 0 = \color{red}{\frac{3}{16}}
\end{aligned}
$$
## Esperance d'une fonction de 2 v.a.r discretes
$$
\begin{aligned}
X(\omega)=\{x_1,...,x_i\}\\
Y(\omega)=\{y_1,...,y_j\}
\end{aligned}
\biggr\}Z=g(X,Y)\\
E(Z) = E(g(X,Y)) = \sum_{i,j}g(x_i,y_j)\mathcal P((X=x_i)\cap(Y=y_i))
$$
:::success
$$
E(Z) = \sum_{i,j}g(x_i,y_j)P_{i,j}
$$
:::
### Exemple
$g(X,Y) = X,Y$
:::success
$$
\begin{aligned}
E(X.Y) &= \sum_{i,j}x_iy_j\mathcal P((X=x_i)\cap(Y=y_j)) \\
&= \sum_{i,j}x_iy_jP_{i,j}
\end{aligned}
$$
:::
## Proposition
:::info
**Proposition**
Si $X$ et $Y$ sont 2 v.a. independantes alors
:::danger
$$
E(X.Y) = E(X)E(Y)
$$
:::
:::
### Demonstration
$$
E(X.Y) = \sum_{i=1}^r\sum_{j=1}^sx_iy_jP_{i,j}
$$
or $X$ et $Y$ sont independantes $P_{i,j} = P_{i\circ}\circ P_{\circ j}$
$$
\begin{aligned}
E(X.Y) &=\sum_{i=1}^r\sum_{j=1}^sx_iy_jP_{i\circ}P_{\circ j}\\
&= \sum_{i=1}^rx_iP_i\biggr(\sum_{j=1}^sy_jP_{\circ j}\biggr)\\
&= \sum_{i=1}^rx_iP_{i\circ}E(Y)=E(X)E(Y)
\end{aligned}
$$
:::success
$$
E(X.Y) = E(X)E(Y)
$$
:::
:::warning
La reciproque est fausse
:::
### Contre-exemple
$(X,Y)$ couple de loi conjoite
|$X / Y$|0|1|2|$P_{i\circ}$ (Loi de $X$)|
|-------|-|-|-|-------------------------|
|0|$\frac{1}{20}$|$\frac{1}{4}$|0|$\frac{3}{10}$|
|1|$\frac{17}{60}$|$\frac{1}{4}$|$\frac{1}{6}$|$\frac{7}{10}$|
|$P_{\circ j}$ (Loi de $Y$)|$\frac{1}{3}$|$\frac{1}{2}$|$\frac{1}{6}$|$1$|
$$
\begin{aligned}
E(X.Y) &= \sum_{i=0}^1\sum_{j=0}^2i.jP_{i,j}\\
&= 1\times\frac{1}{4}+2\times\frac{1}{6} = \frac{1}{4} + \frac{1}{3} = \frac{7}{12}\\
E(X) &= \sum_{i=0}^1iP_{i\circ}=\frac{7}{10}\\
E(Y) &= \sum_{j=0}^2jP_{\circ j} = \frac{1}{2} + \frac{2}{6} = \frac{5}{6}\\
E(X.Y) &= \frac{7}{12} = E(X)E(Y)
\end{aligned}\\
$$
et pourtant $X$ et $Y$ ne sont pas independantes car
$$
P((X=0)\cap(Y=2)) = 0\\
P(X=0).P(Y=2) = \frac{3}{10}\times\frac{1}{6}=\frac{1}{20}
$$
## Covariance et coefficient de correlation lineaire
:::info
**Definition**
$X$ et $Y$ 2 v.a. discretes.
On appelle covariance de $(X,Y)$ le nombre reel
:::danger
$$
Cov(X,Y)=E((X-E(X)(Y-E(Y))))
$$
:::
:::
:::info
**Proposition**
$$
Cov(X,Y)=E(X.Y) - E(X)E(Y)
$$
:::
### Demonstration
$$
\begin{aligned}
Cov(X,Y) &= E(\overbrace{(X-E(X))}^{\text{var centree}}\overbrace{(Y-E(Y))}^{\text{var centree}})\\
&= E(XY-XE(Y) - E(X)Y + E(X)E(Y))\\
&= E(X.Y) - E(Y)E(X) - E(X)E(Y) + E(X)E(Y)
\end{aligned}
$$
Cat $E$ est lineaire
:::success
$$
Cov(X,Y) = E(XY) - E(X)E(Y)
$$
:::
**Remarque**: Si $X$ et $Y$ sont independantes alors $Cov(X,Y)=0$
:::info
**Definition**
On appelle coefficient de correlation lineaire
:::danger
\mathcal C(X,Y)=\frac{Cov(X,Y)}{\sigma_x\simga_y}
:::
- $\sigma_x=\sqrt{V(X)}$
- $\sigma_y=\sqrt{V(Y)}$
:::