--- tags: multilabel --- # Multilabel Multilabel函式庫: Scikit-learn -> [scikit-multilearn](http://scikit.ml/index.html) :::info Multilabel(多標籤): 多個類別,且每筆資料可被標註成一個或多個不同的類別。 Multiclass(多類別): 多個類別,但每筆資料只分配到其中一個類別。 ::: ## 解決Multilabel問題的技術 1. 問題轉換: 把多標籤問題轉為單標籤問題。 - 二元關聯 (Binary Relevance): 因為單獨處理每個目標變量,所以缺點是不考慮標籤的相關性。 - 分類器鏈 (Classifier Chains): 基於原有的輸入和先前的分類結果,所以保有標籤相關性。若比二元關聯低,則代表之間可能沒有標籤相關性。 - 標籤Powerset (Label Powerset): 將問題轉話為一個多分類問題,把每一個可能的標籤組合提供了一個獨特的類。但缺點是會隨著標籤組合的增加,而提升模型複雜度。 2. 改編算法: 提供各式演算法改編成多標籤版本(如: kNN -> MLkNN)。 3. Ensemble: Scikit-Multilearn 提供不同的組合分類功能。 ## 參考資料 [問題轉換](http://www.atyun.com/5376.html)