[D20] 物件偵測(1)

# [D20] 物件偵測(1) 物件偵測（Object Detection）是影像辨識中重要的一環～物件偵測就是在照片或影片等圖像內容中，用＂**框**＂標出物件的範圍，並且**分類**為何種物件及附帶他是此物件的猜測**機率**。前面有提過：卷積神經網路（CNN）開始大量的被運用來提升辨識率，可以用來辨識影像。除了辨識影像，另一個研究方向就是物件的偵測，除了分類，還要框出物件的位置。而且除了框出物件的位置還要能即時的反應物件的移動。 ![](https://i.imgur.com/4iCMvfU.jpg)　 ### 種類物件偵測分為兩大類： **two stage** 和 **one stage** * Two stage 先用演算法生成樣本的候選框，再透過卷積神經網絡做影像辨識，是電腦物件偵測中的一般作法。 * One stage 很字面上的意思，物件的類別和位置偵測及物件辨識一步到位！這樣的做法速度很快，但精確度就比 two stage 略低了一些。但整體辨識率仍在可接受範圍內，因此 One stage 的方法是目前比較多人研發用在行動裝置上的方法。 ![](https://i.imgur.com/anLgH5i.png) ### 名詞解釋現在先來認識一下在物件偵測中會經常看到的名詞吧～ * Selective Search 這就是上面 two stage 中提到的演算法，透過人工的方式先把物件可能在的地方挑選出來。 * Region Proposal 經由演算法所挑選出的區域，我們稱為 Region Proposal。 * Bounding box 我們在文章一開始提到的＂框＂，就是影像辨識中的　bounding box。它含有四個參數（`bx, by, bh, bw`），分別代表框的 x 座標、y座標、長和寬。 * Ground truth bounding box 需要又實際的基準可以比較，而那個基準就稱為 Ground truth，可視為影像中真正包含目標物件的　bounding box。 * Object classification & localization 物件的**分類**和**定位**是物件偵測中最主要的步驟，剛剛認識的 two stage 就是將這兩個步驟分開來做；而 one stage 則是將兩步驟一起處理。 **未完待續．．．．．．* [圖片來源1](https://technews.tw/2020/11/09/yolov4-hong-yuan-mark-liao/) [圖片來源2](https://chih-sheng-huang821.medium.com/%E6%B7%B1%E5%BA%A6%E5%AD%B8%E7%BF%92-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC%E4%B8%8A%E7%9A%84%E6%A8%A1%E5%9E%8B%E7%B5%90%E6%A7%8B%E8%AE%8A%E5%8C%96-e23fd928ee59)