Convolutional Neural Networks
Course: ML2022, 李宏毅
影像辨識的隱藏層作用是辨認某些關鍵pattern
Convolutional layer特色包含Receptive Field和Parameter Sharing
CNN Model專為影像設計,即使Model bias較大,對影像來說可以接受
概念和影像相通的任務也許也可以用CNN
影像中包含許多Patterns,通常觀察Pattern只需要看局部的範圍
影像中的patterns可能會重複出現在不同位置
用在不同的任務(例如語音、文字辨識)需要重新設計Receptive Field和共享參數方式
CNN對放大、縮小、旋轉的辨識度不佳,需要另外做Data Augmentation增加database
Convolutional layer包含許多Filter,會將圖片過濾出重要資訊,產生Feature map
經過CNN layer產生的Feature map的channel數目等於上一層Filter數目
CNN Network越深,Filter觀察的範圍越大
每個Filter和輸入影像作Convolve等同於讓每個Neuron共享參數
Pooling是一種Subsampling,對偵測小細節的任務表現會較差
1. 機器學習透過預設的操作方法集尋找適合的資料表示法 机器学习算法在寻找这些变换时通常没有什么 创造性,而仅仅是遍历一组预先定义好的操作,这组操作叫作假设空间(hypothesis space)。 2. 深度學習透過資料變換,實現將輸入映射到目標這件事,而資料變換的方法是通過觀察例子學習到的 机器学习是将输入(比如图像)映射到目标(比如标签“猫”),这一过程是通过观察许多输入和目标的示例来完成的。你还知道,深度神经网络通过一系列简单的数据变换(层)来实现这种输入到目标的映射,而这些数据变换都是通过观察示例学习到的。 3. 損失函數用來計算預測和真實數值的距離,以衡量網路效果
Aug 3, 2022紀錄關鍵字&重點部分。後續須另外找資源和練習。 https://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.php https://github.com/virginiakm1988/ML2022-Spring https://www.kaggle.com/competitions/ml2022spring-hw1/overview https://pytorch.org/docs/stable/data.html#torch.utils.data.Dataset [toc] Week 1
Jul 25, 2022Source: 李宏毅ML2022Course [toc] General Guide Model Bias Model Bias是因為model太過簡單,所包含的function set太少
Jul 25, 2022輸入的聲音訊號是一串向量 輸出的文字是一串token Token的形式例如Phoneme,發音能夠識別的最小單位,類似音標 Lexicon紀錄文字和phoneme間的轉換方式 Phoneme和聲音訊號之間的關聯比較明確 ![](https://i.imgur.com/iCNJOkv.png
Jul 22, 2022or
By clicking below, you agree to our terms of service.
New to HackMD? Sign up