# Data mining ## Formula ### Cosine ![image](https://hackmd.io/_uploads/Sy4K3jQVT.png =x300) ![image](https://hackmd.io/_uploads/HkU3pomV6.png =x200) ### Gini ![image](https://hackmd.io/_uploads/By4Bk2X4a.png =x200) ![image](https://hackmd.io/_uploads/SyQdkn7Ea.png =x50) ![image](https://hackmd.io/_uploads/BJ3YITu4a.png =x200) Gain càng lớn càng tốt ![image](https://hackmd.io/_uploads/ry6SUa_4T.png =x250) ### Sửa lỗi laplace ![image](https://hackmd.io/_uploads/SJWNrTdNT.png =x150)![image](https://hackmd.io/_uploads/ByLdB6d4p.png =x180) ![image](https://hackmd.io/_uploads/ry4hVTuVT.png =x200) ## K-medoids ![image](https://hackmd.io/_uploads/ryOUNs_Np.png =x150) ![image](https://hackmd.io/_uploads/r1LV4a_E6.png =x200) ## DBSCAN ![image](https://hackmd.io/_uploads/Hk7eT3OE6.png =x160)![image](https://hackmd.io/_uploads/ByugVaOVa.png =x150) ![image](https://hackmd.io/_uploads/H1Cn7aONa.png =x200) ## Apriori https://viblo.asia/p/thuat-toan-apriori-khai-pha-luat-ket-hop-trong-data-mining-3P0lPEv85ox https://viblo.asia/p/khai-pha-du-lieu-va-lop-bai-toan-khai-thac-cac-tap-pho-bien-p2-m68Z0W06KkG#_thuat-toan-fp-growth-4 ![image](https://hackmd.io/_uploads/rkf9osdEa.png =x100)![image](https://hackmd.io/_uploads/HJ89Zm7P6.png =x160) Diffset là các thành phần khác nhau. ![image](https://hackmd.io/_uploads/rktWM7QPp.png =x130)![image](https://hackmd.io/_uploads/BydOmQXP6.png =x140) ![image](https://hackmd.io/_uploads/SkA9NmXPp.png =x130)![image](https://hackmd.io/_uploads/BkuZHQ7vT.png =x100) ![image](https://hackmd.io/_uploads/HJxOSXXD6.png =x130)![image](https://hackmd.io/_uploads/HkrCBmQvT.png =x140) Độ hỗ trợ là count của phần tử đó. ![image](https://hackmd.io/_uploads/rySk2juEp.png =x400) ### Hạn chế ![image](https://hackmd.io/_uploads/SJfMWmQDa.png =x120) ### Eclat ![image](https://hackmd.io/_uploads/SkUdG0_N6.png =x290)![image](https://hackmd.io/_uploads/BJF6XCdV6.png =x300) ![image](https://hackmd.io/_uploads/SyJpEC_V6.png =x300) ### Charm ![image](https://hackmd.io/_uploads/rkqb8AdN6.png =x300)![image](https://hackmd.io/_uploads/HyXI8C_VT.png =x270) Cái nào có trong list rồi thì loại ### GenMax ![image](https://hackmd.io/_uploads/S188SRuNT.png =x200) ![image](https://hackmd.io/_uploads/SyDFSRu46.png =x300) Loại các nhánh không đủ 50% ## Purify ![image](https://hackmd.io/_uploads/BJ0r3sdEp.png) ![image](https://hackmd.io/_uploads/Hy9ino_E6.png) ![image](https://hackmd.io/_uploads/BkPp33uV6.png =x200) khoảng cách giữa các điểm trong cụm tới tâm và khoảng cách tâm các cụm với nhau. Tâm các cụm(BSS) càng xa càng tốt, còn khoảng cách từ điểm tới tâm(WSS) càng nhỏ càng tốt. ## EI ![image](https://hackmd.io/_uploads/H1shLm7P6.png =x200) Lúc này mỗi vật phẩm đều có giá (trọng số) nên bài toán sẽ khác. ![image](https://hackmd.io/_uploads/rkgsvQmv6.png =x170)![image](https://hackmd.io/_uploads/Syb3vQXDT.png =x190) VME là bài toán ngược tìm tập không phổ biến.