# 3/11中研meeting ## 大老師 ## 小老師 ## sing 宇、 * 可解釋性(interpretability) : 以一種人類可理解的方式將特徵值與模型預測聯繫起來,使人們能夠認可模型預測結果。 * 何時可不須有可解釋性: * 在低風險的環境中使用的模型不需要,因為即使結果錯誤也不會造成嚴重後果(如電影推薦系統) * 已經被廣泛研究和評估的方法(例如,光學字符識別OCR) 也不需要 ### Interpretability method classification #### 1. intrinsic or post-hoc 本質 (intrinsic) : 通過限制機器學習模型的複雜性 (訓練階段) —> 採用結構簡單的具有可解釋性的機器學習模型,如單顆決策樹模型、線性模型 事後 (post-hoc) : 在訓練後通過分析特徵輸入和輸出解釋模型 (預測階段)—>採用與 模型無關的解釋方法,如置換特徵重要性、特徵依賴圖。 #### 2. Model-specific or model-agnostic model-specific方法 : 指的是解釋方法僅限於特定的模型類,這些方法依賴於模型的本身功能(例如:決策樹的規則、線性回歸的權重等等)。 model-agnostic方法 : 指的是與模型架構無關,可用於任何機器學習模型 ,並且屬於事後可解釋性。 #### 3. classification based on the outcome: * Feature summary statistics(特徵概要統計) * Feature summary visualization(特徵摘要可視化) * Model internals approach(模型內部方法) * data point interpretability(數據點可解釋性) * Intrinsically interpretable models(內在可解釋模型) #### 4. local or global * 區域性(local):解釋局部模型的預測行為。 * 全域性(global):解釋整個模型的預測行為。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up