# **Unsupervised Learning** ### K-Means #### 數值方法(演算法) - step1:先亂分成K組 - step2:算出各個組的平均 - step3:再將每一個數與組別平均相減找小的歸為那組 - step4:不斷重複,直到穩定。 #### 數學方法 - $$ n個值分K組 : H_{k}^{n-k} $$ - 僅為局部最佳,會受到起始點影響,需要重複驗證 - #### minimize Within-Cluster Variation $$ \arg \min_{C_{i}} \sum_{i=0}^n {WCV} $$ - ### 階層式分群法(hierarchical clustering) #### dendrogram ![](https://i.imgur.com/Fd5h9dH.png) #### linkage! > dissimilarities 類似距離 > - correlation based > - Eucliden distance ![](https://i.imgur.com/3q0QXzE.png) 變數的單位是重要的 >> 標準化 ```sequence 艾莉絲->包柏: 哈摟,你好嗎? Note right of 包柏: 包柏思考中 包柏-->艾莉絲: 我很好,謝謝! Note left of 艾莉絲: 艾莉絲回應 艾莉絲->包柏: 最近過得怎樣? ```