# Data mining
## Formula
### Cosine


### Gini



Gain càng lớn càng tốt

### Sửa lỗi laplace


## K-medoids


## DBSCAN


## Apriori
https://viblo.asia/p/thuat-toan-apriori-khai-pha-luat-ket-hop-trong-data-mining-3P0lPEv85ox
https://viblo.asia/p/khai-pha-du-lieu-va-lop-bai-toan-khai-thac-cac-tap-pho-bien-p2-m68Z0W06KkG#_thuat-toan-fp-growth-4

Diffset là các thành phần khác nhau.



Độ hỗ trợ là count của phần tử đó.

### Hạn chế

### Eclat


### Charm

Cái nào có trong list rồi thì loại
### GenMax


Loại các nhánh không đủ 50%
## Purify



khoảng cách giữa các điểm trong cụm tới tâm và khoảng cách tâm các cụm với nhau.
Tâm các cụm(BSS) càng xa càng tốt, còn khoảng cách từ điểm tới tâm(WSS) càng nhỏ càng tốt.
## EI

Lúc này mỗi vật phẩm đều có giá (trọng số) nên bài toán sẽ khác.

VME là bài toán ngược tìm tập không phổ biến.