林軒田機器學習基石筆記 - 第十二講
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
上圖是一個 Non-Linear Separable ( Circle Separable ) 的情況,在現實中,絕大多數的情況都是非線性可分。
Linear Separable 的情況下, ( 複雜度 ) 受到控制,很容易可以確保 與 會很接近,但是在 Non-Linear 的情形下, 是不受控制的,用任何的直線都會造成 極高。
我們從上例來看 :
這樣的 Circle Separable 我們可以輕易的造出一個圓來作為 hypothesis
( 過原點,半徑為 的圓 )
這導致整個 hypothesis 變成一個 Quadratic (二次) Hypothesis,為了想要使用我們先前學過的 linear classification 因此必須在二次項部分做一個轉換
:
這一連串的步驟其實就是把原本 X 空間的向量轉成 Z 空間的一次方向量,然後我們再於 Z 空間裡面進行我們先前所學的線性操作。
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
(我借用 SVM 的 wiki 其中一張圖,我覺得可以很明確表達出整個 Transformation 的概念 )截至目前為止我們都僅討論「特殊」的 Quadratic Hypothesis ( 過原點、無一次項 ),下列條列出這些特殊形態經過轉換後 的型態 :
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
General Quadratic Hypothesis Set
如果我們的二次式並沒有像上述一樣這麼特殊呢 ?
應該說,現實的狀況都沒有這麼的特殊,我們必須要有一套一般化的 Transformation :
: via
在 Z-space 中的 perceptron 可對應到 X-space 中的 quadratic hypothesis
在 Z-space 中好的 perceptron 理應可對應到 X-space 中好的 quadratic hypothesis
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
Step 1 : 將 轉換成
Step 2 : 於 Z-space 中進行 linear 操作找出
Step 3 :
Q次多項式轉換 on d-dimension
上面說的多項式轉換,除了在二次式上進行一般化外,我們更可以泛化到更高次方。
:
via
從上式我們可以知道
經過Q次方轉換後的 Z-space 維度
我們該如何選擇 Q 值 ?
機器學習中有兩個最核心的問題 :
(1) 如果我們使用了較高次方的多項式轉換,複雜度較高, 但
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
(2) 那我們反過來試著讓複雜度盡量小呢 ?
從本篇筆記最初的那個 Circle Separable的例子來看,我們好像可以找到複雜度很小的 Hypothesis
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
這在機器學習中人們常常會犯的錯誤,從資料本身,經由人類使用者來做修正,這樣的修正並非機器學習而得,而是經由我們人腦運作後的結果,這些本該是機器學習的計算成本,但我們將其忽略。
這樣的方式往往會高估了我們產生的 model。
那到底我們該怎麼做選擇呢 ?
我們來重新思考並重述整個多項式變換的過程 :
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
從低次方轉換我們可以迭代到高次方轉換,從這樣子的代換過程我們可以了解整個 Hypothesis Set 的結構
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
從上圖我們可以推出下列結果 :
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
當我們的 Hypothesis Set 變大,相當於我們可以被 shatter 的點變多,
於是 會持續增加
當我們的 Hypothesis Set 變大,也相當於我們更有機會找到更低的
這樣的結果我們其實也在前面已經有看過了 :
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
從上面這些結果來看,我們如果一開始使用較高的Q值,容易出現 過大的情況,最好的方式我們還是從低次方開始向上迭代,找到最好的
後記 :
這一篇章感覺來的有點突兀,但其實它非常的重要,我們在機器學習中常聽到的 支持向量機 (SVM) 便是由這樣的概念出發,不同的變換 (不一定是多項式轉換),也會形成不同的 kernel ,這些都不斷的圍繞在往後機器學習技法課程中。