--- tags: OPERA, joffrey.chambon title: RO stochastique Cours 2 --- # Chaîne de Markov Système observé à des instants discrets $t = k\tau$, le système est dans un état chaîne -> liste des états observés chaîne de Markov -> mécanisme de "transition" -> matrice M $p_{ij}$ = proba, si le sys est dans l'état i à $t = k\tau$, que le syst passe dans l'état j à $t=(k+1)\tau$ **Régime transitoire** : on s'intéresse aux premiers instants à $t=k\tau$ -> $\prod _{k} =$ $\begin{bmatrix}\prod _{k}^A & ... & \prod _{k}^E\end{bmatrix}$ $\prod_k^A$ = proba syst état A à $t=k\tau$ à t = 0, état connu on connaît M, on peut calculer $\prod_k$ $\forall k$ $\prod_k = (\prod_{k-1}) * M, k=1, \prod_k= (\prod_0)*M^k$ ## Régime permanent Condition : $\lim_{k \to +\infty} \prod_k$ Si cette limite existe, et si elle est indépendante de l'état initial, la chaine de Markov est **ergodique** Pour la matrice d'exemple : 5 états intiaux probables * Animal en A : * $\prod_0 = \begin{bmatrix}1 & 0 & 0 & 0& 0\end{bmatrix}$ * $\prod_1 = \begin{bmatrix}0.2 & 0.5 & ...\end{bmatrix}$ * Animal en B : * $\prod_0 = \begin{bmatrix}0 & 1 & 0 & 0& 0\end{bmatrix}$ * $\prod_1 = \begin{bmatrix}0 & 1 & 0 & 0& 0\end{bmatrix}$ * $\prod_{+\infty} = \begin{bmatrix}0 & 1 & 0 & 0& 0\end{bmatrix}$ ... * Animal en E : * $\prod_0 = \begin{bmatrix}0 & 0 & 0 & 0& 1\end{bmatrix}$ * ne converge pas vers la limite de B, donc non ergodique ## Conditions suffisantes d'ergodicité 3 conditions : * Le graphe est fini * Le graphe est fortement connexe * Le graphe contient au moins une boucle :::warning Le graphe peut être ergodique sans vérifier ces conditions puisqu'elles ne sont pas nécéssaires ::: Graphe de transition : * sommets -> états * arcs -> transition i($k\tau$)->j($(k+1)\tau$) * valuation -> $p_{ij}$ Ici, les 3 conditions suffisantes d'ergodicité ne sont pas vérifiéés, la condition 2 n'est pas vérifiée, donc on ne peut pas conclure Ici, on a conclu en examinant le cas particulier de la $2^{ème}$ colonne ## Application plus simple * 3 compartiments : C,D,E ![](https://i.imgur.com/CKCX1eR.png) $M = \begin{bmatrix}0.3 & 0.4 & 0.3\\ 0.3 & 0.7 & - \\ 0.4 & - & 0.6\end{bmatrix}$ avec CDE pour lignes et colonnes Les 3 conditions suffisantes sont vérifiées donc $\prod_{\infty}$ existe ### Calcul du vecteur $\prod_{\infty}$ lorsque la chaîne de Markov est ergodique $\prod_{k} = (\prod_{k+1}) * M$ $\prod_{\infty} = \prod_{\infty} * M$ $\sum_i \prod_{\infty}^i = 1$ sachant que : * $\prod_{\infty}^C = c$ * $\prod_{\infty}^D = d$ * $\prod_{\infty}^E = e$ $\prod_{\infty} = \begin{bmatrix}\prod_{\infty}^C & \prod_{\infty}^D & \prod_{\infty}^E\end{bmatrix} = \begin{bmatrix}\prod_{\infty}^C & \prod_{\infty}^D & \prod_{\infty}^E\end{bmatrix} * \begin{bmatrix}0.3 & 0.4 & 0.3\\ 0.3 & 0.7 & - \\ 0.4 & - & 0.6\end{bmatrix}$ on a donc un système : $c = 0.3*c + 0.3*d + 0.4*e$ $d = 0.4*c + 0.7*d$ $e = 0.3*c + 0.6*e$ $\prod_{\infty} = \begin{bmatrix}c & d & e\end{bmatrix} = \begin{bmatrix}12/37 & 16/37 & 9/37\end{bmatrix}$ ### Interprétation #### Interprétation ponctuelle Si on observe le système à n'importe quel moment au sein du régime permanent : * la proba d'observer l'animal en C est de 12/37 et ceci quel que soit l'instant d'observation On peut parler de "disparition du hasard" ou **stabilisation macroscopique** Régime transitoire -> **agitation microscopique**, ssi la chaîne de Markov est ergodique il y a une **stabilisation macroscopique** avec le régime permanent #### Interpétation statistique On observe l'animal toutes les secondes pendant 1 heure, on a donc 3600 "photos", on peut alors trier les photos : * photos de type C * photos de type D * photos de type E On devrait alors avoir la réparition suivante : * 12/37 * 16/37 * 9/37 Si on réitère l'expérience, on devrait obtenir à peu près les mêmes proportions ## 2ème Application (p114) Un garagiste parisien, dispose de 4 véhicules loués à la journées. Chaque véhicule loué peut tomber en panne avec une proba $p$ et une proba de non-panne $p=q-1$ Le garagiste peut faire 1 seule réparation par journée $\tau$ = 1 journée Demande supérieure à l'offre Le garagiste ne loue des véhicules que si il y a au moins 2 véhicules en état de marche au début de la journée. ### Q1 : Modéliser le fonctionnement à l'aide d'une chaîne de Markov Besoin de modifier le problème réel pour l'adapter en chaîne de markov : système considéré, $\tau$, états possibles à $t=k\tau$, matrice de transition M, graphe de transition * états : nb de véhicule qui marchent en début de journée * 4 états : A(1), B(2), C(3), D(4) -> impossible d'avoir 4 véhicules en panne * Matrice : * 1ère ligne de M : hypothèse à $t=k\tau$, système dans l'état A, pas de location , le vendeur répare 1 véhicule durant la journée, 1 possiblité * 2ème ligne de M : hypothèse à $t=k\tau$, système dans l'état B. 3 possiblité : * 0 panne : $q²$ * 1 panne : $2pq$, facteur 2 : nombre de manière pour que le véhicule tombe en panne * 2 pannes : $p²$ * 3ème ligne de M : état C -> 3 véhicules marchent et ils sont loués. 4 possibilités : * 0 panne : $q^3$ (D) * 1 pannes : $C_3^1 pq² = 3pq²$ ( C ) * 2 pannes : $C_3^2 p²q = 3p²q$ (B) * 3 pannes : $p^3$ (A) * 4ème ligne de M : état D -> 4 véhicules marchent et ils sont loués. 5 possibilités : * 0 panne : $q^4$ (D) * 1 panne : $4pq^3$ (D) * 2 pannes : $6p²q²$ ( C ) * 3 pannes : $4p^3q$ (B) * 4 pannes : $p^4$ (A) * $M = \begin{bmatrix}0 & 1 & 0 & 0\\ p² & 2pq & q² & 0\\ p^3 & 3p²q & 3pq² & q^3 \\ p^4 & 4p^3q & 6p^2q^2 & 4pq^3 + q^4\end{bmatrix}$ On pose : $p = \frac{1}{2} = q$ Donc, on a : $M = \begin{bmatrix}0 & 1 & 0 & 0\\ 1/4 & 2/4 & 1/4 & 0\\ 1/8 & 3/8 & 3/8 & 1/8 \\1/16 & 4/16 & 6/16 & 5/16\end{bmatrix}$ ### Q2 : Régime transitoire Initialement, les 4 véhicules sont en état de marche Quelles sont les probabilités des 4 états possibles au bout d'1 journée et de 2 journées ? à $t = 0$, $\prod_0 = \begin{bmatrix}0 & 0 & 0 & 1\end{bmatrix}$ à $t = \tau$, $\prod_1 = \prod_0 * M = \begin{bmatrix}1/16 & 4/16 & 6/16 & 5/16\end{bmatrix}$ à $t = 2\tau$, $\prod_2 = \prod_1 * M = \begin{bmatrix}33/256 & 104/256 & 82/256 & 37/256\end{bmatrix}$ ### Q3 : Régime permanent Au bout d'un grand nombre de jour de location, existe-t-il une limite aux probabilités des états du parc de véhicules ? (limite indépendante de l'état inital) $\prod_0 = \begin{bmatrix}0 & 0 & 0 & 1\end{bmatrix}, \to_{k\to +\infty} \prod_{\infty}$ ? $\prod_0 = \begin{bmatrix}0 & 0 & 1 & 0\end{bmatrix}, \to_{k\to +\infty} \prod_{\infty}$ ? ... Ici, les 3 conditions suffisantes d'ergodicité sont vérifiées : * graphe fini * fortement connexe * au moins 1 boucle $\prod_{\infty}$ existe et est indépendant de $\prod_0$ #### Calcul de $\prod_{\infty}$ $\prod_{\infty} = \begin{bmatrix}\prod_{\infty}^A & \prod_{\infty}^B & \prod_{\infty}^C & \prod_{\infty}^D\end{bmatrix} = \begin{bmatrix}a & b & c & d\end{bmatrix}$ On a un système : $a = 1/4*b + 1/8*c + 1/16*d$ $b = a + 2/4*b + 3/8*c + 4/16*d$ $c = 1/4*b + 3/8*c + 6/16*d$ $d = 1/8*c + 5/16*d$ :::info Pour vérifier qu'il n'y a pas d'erreur : $a+b+c+d = 1$ ::: $\prod_{\infty} = \begin{bmatrix}a & b & c & d\end{bmatrix} = \begin{bmatrix}61/361 & 136/361 & 88/361 & 16/361\end{bmatrix}$ #### Interprétation statistique de l'ergodicité Pendant 1 an on prend une "photo" chaque jour, si on tri ces "photos", on aura la réparition décrite dans la matrice $\prod_{\infty}$. Et si on répète l'expérience, on aura à peu près les mêmes proportions Le garagiste peut calculer à l'avance sa recette annuelle et cette recette sera la même chaque année. On remarque que le dénominateur $361 \approx 365$, on a donc : * 2 mois dans l'état A (1 véhicule marche), pas de recette * 6.5 mois dans l'état B (2 véhicules loués), recette * 3 mois dans l'état C (3 véhicules loués), recette * 0.5 mois dans l'état D (4 véhicules loués), recette On est très peu dans l'état D car on a pris une proba de panne élevée. **Avantage de l'ergodicité : on a un calcul déterministe malgré l'agitation microscopique** ### Q4 : Reprendre la modélisation dans les cas limites (p = 0 et p = 1) #### p = 0 Le véhicule ne tombe jamais en panne Comportement déterministe, q=1 $M = \begin{bmatrix}0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1 \\0 & 0 & 0 & 1\end{bmatrix}$ état D -> état permanent absorbant. Au bout de 3 jours , le système sera dans l'état D indéfiniment #### p = 1 Le véhicule tombe toujours en panne On a donc, q = 0 $M = \begin{bmatrix}0 & 1 & 0 & 0\\ 1 & 0 & 0 & 0\\ 1 & 0 & 0 & 0 \\1 & 0 & 0 & 0\end{bmatrix}$ Cycle permanent absorbant A-B-A-B-etc Au bout d'une journée au plus, le système est piégé dans le cycle ABAB... Donc, processus déterministe # Processus de Markov Généralisation de la chaîne de Markov dans le cas du temps continu. Plus de notion de chaîne. Problème : **comment introduire la notion de transition alors que le temps n'est plus discrétisé ?** On va introduire la notion d'instant voisin (le voisin est infiniment proche de t) ## Loi de Poisson Utilisée pour décrire des phénomnènes aléatoires, ex : arrivées ou sorties d'usagers dans un bureau de poste. :::info Du Poisson partout ! ::: La probabilité d'observer n arrivée pendant le temps $t$ sera donnée par :::success $P_n(t) = \frac{(\lambda t)^n}{n!} * e^{-\lambda t}$, loi poisson de taux $\lambda$ ::: ### Propriété fondamentale La proba d'une arrivée pendant $dt$ (infiniment petit) vaut $\lambda dt$ Conséquence : pendant le temps $dt$, il n'y a que 2 possibilités : * 1 arrivée se produit : $\lambda dt$ * aucune arrivée : $1 - \lambda dt$ -> proba la plus grande :::info Il est considéré comme impossible d'avoir 2 arrivée observées entre $t$ et $t + dt$ -> la proba que cela arrive est de $(\lambda dt) * (\lambda dt) = \lambda²(dt)²$, donc négligeable ::: :::info S'il y a plusieurs sources d'aléas (G1, G2, ...), on obsevera entre $t$ et $t + dt$ au plus 1 seul évènement (de l'une ou l'autre des différentes sources d'aléas). Il est donc exclu d'avoir pendant le même $dt$ d'avoir 1 arrivée et 1 sortie venant de G1 ::: ## Application * On a un magasin de stockage de composants électroniques avec 3 parties : L1, L2, L3 * On a 2 robots qui se déplacent pour prélever des composants * Chaque robots fait un prélèvement en L1 selon une loi de Poisson de taux $\mu_1$, la proba d'un prélèvement entre $t$ et $t + dt$ est de $\mu_1dt$ * Une fois le prélèvement en L1 fait, le robot se déplace instantanément vers L2 avec la proba $p$ ou L3 avec la proba $q = 1-p$ * Arrivé en L2, le robot stationne jusqu'à ce qu'il effectue un prélèvement, selon une loi de Poisson de taux $\mu_2$ * Arrivé en L3, le robot stationne jusqu'à ce qu'il effectue un prélèvement, selon une loi de Poisson de taux $\mu_3$ * Une fois le prélèvement effecuté en L2 ou L3, le robot retourne instantanément en L1 * Si les 2 robots sont présents dans le même lieu à un instant donné, seul le premier arrivé peut effecuter un prélèvement On peut décrire le fonctionnement du système qui est formé avec les 3 lieux et les 2 robots à l'aide d'un processus de Markov, car les sources d'aléas sont TOUTES régies par des lois de Poisson.