Vežbe - HackMD

# Vežbe ## SPSS ### Record Ops * Select -> kao select u SQL-u, služi za izbacivanje vrednosti npr. ### Field Ops * Type -> čitanje vrednosti, definisanje nedostajućih * Filter -> izbacuje kolone * Derive -> pravi novu kolonu i popunjava je na osnovu zadatog izraza * Filler -> ako vrednost ispunjava uslov, zamenimo je sa nečim što želimo * Reclassify -> mapira vrednosti atributa na željene vrednosti * Binning -> klasifikacija na osnovu nekih vrednosti, podela u grupe, npr. koliko je standardnih devijacija od proseka ili deli u grupe jednake veličine * Partition -> deli podatke na training i test skupove * SetToFlag -> slično kao `Restructure` * Restructure -> za svaku moguću vrednost nominalnog atributa pravi novu kolonu, stavlja 1 na odgovarajuće mesto, sve ostalo stavlja 0 ### Modeling #### Supervised * C5.0 -> stablo odlučivanja, formira node model iz kog se čitaju stvari * KNN -> na osnovu K najbližih suseda određuje klasu kojoj dati podatak pripada * PCA/Factor -> smanjuje broj kolona na zadati broj, pri čemu se čuva što veća varijansa #### Association * Apriori - detektuje pravila pridruživanja i njihove karakteristike #### Segmentation * K-means - klasteruje podatke u klaster sa najbližom srednjom vrednosti ### Graphs * Graphboard - za različite atribute se biraju grafikoni itd, može se eksportovati, mogu da se nameste boje u Appearance * Web - prikazuje učestalost zajedničkog pojavljivanja kategoričkih vrednosti ## Papir zadaci Vežbe 4 performanse, 8 K sredina, 9 hijerarhijsko klasterovanje, 11 apriori alg