# [D20] 物件偵測(1) 物件偵測(Object Detection)是影像辨識中重要的一環~ 物件偵測就是在照片或影片等圖像內容中,用"**框**"標出物件的範圍,並且**分類**為何種物件及附帶他是此物件的猜測**機率**。 前面有提過:卷積神經網路(CNN)開始大量的被運用來提升辨識率,可以用來辨識影像。 除了辨識影像,另一個研究方向就是物件的偵測,除了分類,還要框出物件的位置。而且除了框出物件的位置還要能即時的反應物件的移動。 ![](https://i.imgur.com/4iCMvfU.jpg)  ### 種類 物件偵測分為兩大類: **two stage** 和 **one stage** * Two stage 先用演算法生成樣本的候選框,再透過卷積神經網絡做影像辨識,是電腦物件偵測中的一般作法。 * One stage 很字面上的意思,物件的類別和位置偵測及物件辨識一步到位!這樣的做法速度很快,但精確度就比 two stage 略低了一些。 但整體辨識率仍在可接受範圍內,因此 One stage 的方法是目前比較多人研發用在行動裝置上的方法。 ![](https://i.imgur.com/anLgH5i.png) ### 名詞解釋 現在先來認識一下在物件偵測中會經常看到的名詞吧~ * Selective Search 這就是上面 two stage 中提到的演算法,透過人工的方式先把物件可能在的地方挑選出來。 * Region Proposal 經由演算法所挑選出的區域,我們稱為 Region Proposal。 * Bounding box 我們在文章一開始提到的"框",就是影像辨識中的 bounding box。它含有四個參數(`bx, by, bh, bw`),分別代表框的 x 座標、y座標、長和寬。 * Ground truth bounding box 需要又實際的基準可以比較,而那個基準就稱為 Ground truth,可視為影像中真正包含目標物件的 bounding box。 * Object classification & localization 物件的**分類**和**定位**是物件偵測中最主要的步驟,剛剛認識的 two stage 就是將這兩個步驟分開來做;而 one stage 則是將兩步驟一起處理。 **未完待續......* [圖片來源1](https://technews.tw/2020/11/09/yolov4-hong-yuan-mark-liao/) [圖片來源2](https://chih-sheng-huang821.medium.com/%E6%B7%B1%E5%BA%A6%E5%AD%B8%E7%BF%92-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC%E4%B8%8A%E7%9A%84%E6%A8%A1%E5%9E%8B%E7%B5%90%E6%A7%8B%E8%AE%8A%E5%8C%96-e23fd928ee59)