# 3. HUNG-YI LEE 2022 ML - CNN ###### tags: `Machine Learning` ## img 分類 假設所有照片一樣大小 y head: 為一個one-hot vector,表示可辨識出來的object有多少 y promt: 藉由softmax得出,希望與y head越近越好  ## 影像如何作為imput * one color photo = 3-D tensor * 長 / 寬 / 高(channels,代表RGB) * 拉直為一個向量,作為input  ## 真的需要全連接層嗎 * 模型彈性愈大,愈容易overfitting * 下週以數學角度介紹 * 共產生3 * 10^7個weight  ## 觀察:照片的patterns * 只需要部份照片就夠neuron觀察出來 * 每個neuron只care自己的receptive field * 守備範圍 * kernel size * receptive field彼此可重疊 * padding * stride * 移動量 * 超參數 ## Convolutional Neural Network(健峰) * 卷積層Convolution **對二維資料取出局部特徵值**:針對圖片就是取出期邊緣輪廓等特徵值。 卷積運算:輸入圖片>過濾器>特徵圖 * 池化層Pooling **保留更重要的特徵**,進行**資料壓縮**及保留特徵圖(就是**降維**) 每個區塊中選出最大值或最小值,矩陣變小 6*6 > 3*3 * 平坦化 將資料由矩陣轉為一維陣列 ## Convolutional Neural Network(NTUCS振成) **電腦視覺**: 讓電腦具有人類視覺般的行為 解析度夠才好判別  * 各種圖像   * 簡易圖像識別 * ex1 use image classifier   引入閥值  分類器選擇  * ex2 卷積 & 池化  after 池化層變成如下  * ex3 閥值是3    卷積:透過適當計算找出特徵 設計過濾器(卷積核心):應用在人臉辨識效果很好  缺點: 傳統電腦視覺你要設計很多分類器,因為有各種形體變化(較不通用)!!!! 因此較複雜的任務較不適用 AI強大運算能力將慢慢改善 ## CNN貓狗辨識實作 * 資料集 [googlecreativelab/quickdraw-dataset](https://github.com/googlecreativelab/quickdraw-dataset) 貓狗樣本資料集合併->12萬筆 標籤資料預處理:60000個狗0,60000個貓1 * 貓狗辨識 https://colab.research.google.com/drive/1bFceipDlvQc09_ZTRB3c_THbDDIoSt2W?usp=sharing    常見損失函數 二元分類:二分cross entropy 多元分類:多元cross entropy 回歸問題:均方差 Batch(訓練週期),batch size(每次訓練的量)與Epoch(步伐) * 訓練、驗證和測試資料集步驟  * overfitting 對未見過資料適應度變差 
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up