各機器學習方法發展與介紹

# 各機器學習方法發展與介紹 ## 時間序列 ### 時間序列的應用主要分為以下兩種: * **預測:** 基於過去的時間序列來**預測**未來的時間序列，若中間序列有缺失，也能利用方法對缺失值進行補遺。 **如: 自回歸滑動平均(Autoregressive moving average, ARMA)** ![](https://i.imgur.com/lP0FVKi.png) * **分析:** 將整個時間序列基於季節性、趨勢、雜訊進行分離，借此觀察時間序列有無趨勢或混波現象，也能夠用於濾除雜訊。 **如: 奇異譜分析(Singular Spectrum Analysis, SSA)** ![](https://i.imgur.com/cau2s1B.png) ![](https://i.imgur.com/5YcfBfZ.png) ## 分類方法 ### 分類方法主要分為以下五種: * **關聯性方法:** *計算樣本間的距離(如:歐式距離、曼哈頓距離等...)，將距離較近的樣本分類為同類別。 **如:最近鄰居法(K-Nearest Neighbors, KNN)** ![](https://i.imgur.com/BXZcG6E.png) * **線性模型:** **樸素貝氏分類(Naive Bayes, NB)** 假設特徵間彼此不相關，並計算每個樣本的類別先驗機率，將最高機率的類別標記給樣本。 ![](https://i.imgur.com/EfrjE8Q.png) **支援向量機(Support Vector Machine, SVM)** 利用樣本間的距離，將樣本利用核函數投影至高維度，並建立超平面區分樣本，使超平面盡可能區分更多樣本。 ![](https://i.imgur.com/nQLBdf0.png) * **樹模型:** **ID3:** 基於信息熵計算信息增益，利用信息增益最多的特徵分裂樹節點。 **C4.5:** 改進ID3的版本，增加信息增益率改善ID3容易將分裂點給予特徵類別較多的特徵 **CART:** 能夠進行分類與迴歸的二元樹模型，基於基尼係數(Gini index)使計算更有效率，是許多集成模型的基本單位。 ![](https://i.imgur.com/uguifjN.png) * **集成模型:** 利用多個弱分類器(如:CART)組合而成進行分類，最後結果通常由所有弱分類器投票所得。 **如:梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)** ![](https://i.imgur.com/93kZcof.png) * **神經網路模型:** 多個神經元組合成神經網路，利用反向傳播更新神經元權重，神經元具有一定程度的特徵選取能力。 **CNN:** 通常應用於影像辨識，利用卷積層或池化對圖片進行降維後，在最後接上全連接層進行影像分類。(CNN的概念更早就被提出，圖裡面懶得改) ![](https://i.imgur.com/y9NLLhr.png) **DNN:** 使用多層全連接層進行訓練，通常應用於數據資料分類。 ![](https://i.imgur.com/WiwWhGR.png) **LSTM:** 常應用於與時間有相關性的項目，對影片、音樂、時間序列分類與處理均有較佳的表現，與一般神經網路差別是LSTM的神經元具有記憶能力，因此相同的輸入也會有不同的輸出。 ![](https://i.imgur.com/hbwoGYb.png) ![](https://i.imgur.com/CYGagg8.png) ## 分群方法 ### 分群方法主要分為以下四種: (以下分群GIF均為二維，高維度的情況無法可視化也容易造成維度災難。) **階層式:** 先將每個樣本都當成一個群體，之後對周遭的群體開始合併，直到群的數量達到設定的數。(凝聚式) **如: AGNES** ![](https://i.imgur.com/PWDzocs.gif) **密度式:** 根據樣本間的密度合併資料，需要設定距離與樣本數，如果在距離內的樣本數大於或等於設定的樣本數，則將其分為一群，具有剔除離群點的功能，也能夠自動判斷有幾個群聚。 **如: DBSCAN** ![](https://i.imgur.com/ZqUUvO3.gif) **切割式:** 需要設定起始中心點的位置與中心點數量，計算樣本與中心點的距離，與該中心點距離最近的樣本則為該群，中心點更新方式則是使用隸屬值來移動中心點。 **如: K-means** (如果圖不會動就F5) ![](https://i.imgur.com/kJwxWvM.gif) **格子式:** 無須設定中心點即可判斷有幾個群聚的方法，二維的情況下對樣本周圍生成座標點，在判斷最近的樣本核心來更新座標點，直到所有座標點均收歛至各樣本群核心點時停止，最後與該座標點最近的樣本則為同一群。**如: STING** ![](https://i.imgur.com/aOLtCCc.gif) 分群方法屬於無監督式學習，也較少優劣之分，應用則需要都嘗試看看。 (下面這張圖是威翔做的) ![](https://i.imgur.com/EE8WeS6.png) ## 優化算法 ### 優化算法主要分為...有點多懶得寫了優化算法是拿來解決最佳化問題(如:背包問題,TSP問題)用的，在機器學習上通常用來尋找參數或特徵選取，藉由最後所產生的目標函數來改變輸入數值藉此最小化(或最大化)目標函數的方法。 **PSO:** 優化算法介紹都很麻煩自己找(粒子群演算法) (下圖為尋找二維向量中的最低點) ![](https://i.imgur.com/HeD7FOG.gif) **GA:** 交叉、變異等方法來最佳化。(基因演算法) (下圖為TSP問題，尋找最短路徑) ![](https://i.imgur.com/whUN0qN.gif) 優化算法發展圖 ![](https://i.imgur.com/kZq3hqw.png) 有趣的是PSO到現在還很多人用 1991~2001那邊之前用2016年的鯨群演算法(WOA)，然後對兩個測試函數進行測試分別為Sphere函數與Restrigin函數(測試時為30維)，結果如下: (下圖表示兩種方法對函數的收歛速度) ![](https://i.imgur.com/OKiCf9A.png) 可以發現，WOA收歛速度比PSO快非常多。 ![](https://i.imgur.com/PpFMV9x.png) 在運行時間與收歛值上也是WOA更佳。 # 迴歸方法(有空在補)