# ML01 - Initiation au *Machine Learning* ## TD 1 - Premiers classifieurs ### Tableau individus-variables | **Individu** | *var 1* | *var 2* | classe| |---|---|---|---| | A | 8 | 2 | X | | B | 4 | 5 | O | | C | 4 | 3 | X | | D | 7 | 8 | O | | E | 2 | 4 | X | | F | 7 | 4 | O | | G | 1 | 6 | X | | H | 8 | 3 | X | | I | 6 | 2 | X | | J | 5 | 8 | O | | K | 4 | 7 | X | | L | 6 | 6 | O | | M | 1 | 2 | X | Supposons que l'on observe les points $A, B, \dots , J$. * Placer ces points dans le plan. 1. **Classifieur du plus proche voisin** > Le *classifieur du plus proche voisin* attribue à un individu la classe de l'individu le plus proche dans l'ensemble d'apprentissage, au sens de la distance euclidienne. * a. *Utilisation du classifieur* : A l'aide du classifieur du plus proche voisin, classer les points $K, L$ et $M$. * b. *Précision* : quelle est la proportion d'erreurs commises ? * c. *Frontière de décision et régionnement du plan* : déterminer et colorier l'ensemble des points classés X 2. **Classifieur euclidien** > Le *classifieur euclidien* consiste à affecter un individu au groupe dont le centre de gravité (le point moyen) est le plus proche, au sens de la distance euclidienne. * Mêmes questions 3. **Fluctuation d'échantillonnage** * Reprendre ces questions avec $X_{train} = \{ D, \dots M\}$ et $X_{test} = \{A, B, C\}$ 4. **Implémentation** * Reprendre ces questions en utilisant *python* et les modules *numpy*, *matplotlib.pyplot*, *seaborn* et *sklearn*. ```python import numpy as np import seaborn as sns import matplotlib.pyplot as plt X = np.array([[8, 2], [4, 5], [4, 3], [7, 8], [2, 4], [7, 4], [1, 6], [8, 3], [6, 2], [5, 8], [4, 7], [6, 6], [1, 2]]) y = np.array(['X','O','X','O','X','O','X','X','X','O','X','O','X']) labels = np.array(['A','B','C','D','E','F','G','H','I','J','K','L','M']) sns.scatterplot(x=X[:,0], y=X[:,1], hue=Y) plt.show() ``` 5. **Géométrie analytique** * a. Ecrire explicitement les règles de décision en dimension 3, puis en dimension $m$. * b. Retrouver les frontières de décision en dimension 3, puis en dimension $m$. 6. **Calcul vectoriel** * Mêmes questions.