# Intro, KNN, dmin, Bayes (clasificacion) Lo que hace un clasificador es lo siguiente (tira la linea): ![](https://i.imgur.com/KUmib3Z.png) Los pasos serian, a modo general, los siguientes ![](https://i.imgur.com/oPfbU1m.png) ## KNN Vecinos mas cercanos 1. calcular las distancias entre el punto de testing 2. ordenar los datos 3. se eligen los K vecinos mas cercanos al punto electo 4. hago mayoria de votos respecto a las clases que hay en la vecindad, y en base a los votos se elige de que clase es el punto Por ejemplo ![](https://i.imgur.com/spIpREm.png) Si se elige k=1 el training siempre resulta perfecto, pero es porque esta sobreajustado ## Dmin (distancia minima) Es como version reducida de KNN 1. Calcular los centro de masa de cda clase 2. Solo dejo el centro de masa y luego pongo el punto 3. Veo cual centro de masa es el mas cecano YERA Genera lineas rectas como separacion Si los datos tienen distribuciones, este metodo no ajusta tan bien ![](https://i.imgur.com/2GQJGkY.png) ## Bayes ![](https://i.imgur.com/uSXYmG4.png) ![](https://i.imgur.com/Jfiv5Rv.png) ![](https://i.imgur.com/01CAsJV.png) ![](https://i.imgur.com/BZPEmIN.png) Dado el valor de x (area), calculamos 1. p1, la probabilidad de que sea w1 2. p2, la probabilidad de que sea w2 Clasificamos x como w1 si p1 > p2, x es w2 e.o.c. ![](https://i.imgur.com/wNEyE9p.png) ![](https://i.imgur.com/zLdZw90.png) p(w_i) es la probabilidad a priori ![](https://i.imgur.com/xrmTi9m.png) Al final lo unico que hace es definir un umbral ![](https://i.imgur.com/4IoR1Wd.png) ## Calculo de PDF (ej) ![](https://i.imgur.com/WOFuL2W.png) ![](https://i.imgur.com/qEuhRxC.png) ![](https://i.imgur.com/yxjuGPA.png) ![](https://i.imgur.com/1BgXXJ2.png) ![](https://i.imgur.com/ZOgnDMK.png) LA curva seria el umbral o linea de decision ## Naïve Bayes, para multiples dimensiones ![](https://i.imgur.com/ftDodGR.png)