# Clean y SFS # Cleaning ![](https://i.imgur.com/cukSFCh.png) (Se usa d o y para los labels) 1. Computar la correlación entre columnas de X 2. Si es que hay columnas correlacionadas, entonces elegir una de las dos al azar y sacar las otras (correlacionadas) 3. Eliminar las *features* (constantes) con std < 10^-8 # Selección de características hacia adelante (SFS)(Sequential Forward Selection) Nos podemos casar con cualquier característica (y cuantas queramos), pero no nos podemos divorciar de una con la que nos casamos La gracia es ir incorporando características nuevas que en conjunto con las anteriores hagan un buen trabajo (es trabajo colaborativo, no selección individual) Ej con seleccion de 3 sobre 9 caract ![](https://i.imgur.com/qxFUTvd.png) ![](https://i.imgur.com/vJ250Fj.png) Me caso con la 7 ![](https://i.imgur.com/PVMp5nG.png) ![](https://i.imgur.com/gWSs3Hm.png) Ahora tengo 7 y 8 ... (seguir así) ![](https://i.imgur.com/R1KDUSz.png) El final es 7,8 y 5 (trio seleccionado) porque en CONJUNTO trabajan bien # SBS es el mismo concepto pero comenzando con todos casados y separándose de a poco (eliminando los que menos contribuyen)