# 4/14人臉辨識進度報告 目錄 * Google Facenet 1. dataset 2. model的特色 3. Triplet Loss * 自己的model 1. dataset 2. model 3. 測試結果 --- # Google Facenet ### dataset LFW (Labeled Faces in the Wild)資料集中收錄了 5749 位公眾人物的人臉影像,總共有超過13000多張影像檔案。但大部份公眾人物的影像都只有一張,只有 1680 位有多於一張照片,而極少數有超過 10 張照片。 LFW資料集主要測試人臉識別的準確率,該資料庫從中隨機選擇了6000對人臉組成了人臉辨識圖片對,其中3000對屬於同一個人的2張人臉照片,3000對屬於不同的人每人1張人臉照片。測試過程LFW給出一對照片,詢問測試中的系統兩張照片是不是同一個人,系統給出“是”或“否”的答案。通過6000對人臉測試結果的系統答案與真實答案的比值可以得到人臉識別準確率。 這個集合被廣泛應用於評價 face verification演算法的效能。 ### model的特色 **輸出量化特徵值,而非輸出分類結果** ### Triplet Loss 模型需要取得圖片不同的特徵並映射到歐幾里德的空間中(即計算特徵間的歐氏距離),所採用的作法是 Triplet loss,如下圖原論文中的圖示說明。 ![](https://i.imgur.com/kl9wx7f.png) Triplet Loss 想法在於,如果我們選取與該樣本最相像(差異最小)的錯誤臉孔,與最不像(差異度大)的正確臉孔,同時進行特徵訓練,迭代訓練至誤差降至最小,用以改進模型中的臉孔特徵定義,如此一來,便能得到最佳的辨識結果。 # 自己的model ### dataset 395張 ![](https://i.imgur.com/VI8YxX1.jpg =100x)![](https://i.imgur.com/2Ses8rH.jpg =100x)![](https://i.imgur.com/NEt5KjN.jpg =100x)![](https://i.imgur.com/UsDjcg1.jpg =100x) ![](https://i.imgur.com/a7gyXgW.jpg =100x)![](https://i.imgur.com/t6iqwvy.jpg =100x)![](https://i.imgur.com/ucImKTa.jpg =100x)![](https://i.imgur.com/stAc2A4.jpg =100x) ![](https://i.imgur.com/SajfBA9.jpg =100x)![](https://i.imgur.com/yrHzYQL.jpg =100x)![](https://i.imgur.com/3c7l8Pr.jpg =100x)![](https://i.imgur.com/wMZWL3m.jpg =100x) ![](https://i.imgur.com/e75ghfE.jpg =100x)![](https://i.imgur.com/SsMCIOV.jpg =100x)![](https://i.imgur.com/k6OXvYf.jpg =100x)![](https://i.imgur.com/awwhfFK.jpg =100x) ### train 書語 80張 宣哲 94張 旻瑄 74張 亦良 68張 總共316張 ### test 書語 19張 宣哲 24張 旻瑄 22張 亦良 14張 總共 79張 ### model 採用6層的CNN以及8層Alexnet ### 測試結果 目前最新的測試準確率到達91.1%(使用CNN) # 未來規劃 提升自己model的準確率 讀完paper http://openaccess.thecvf.com/content_CVPR_2019/papers/Pang_Deep_RNN_Framework_for_Visual_Sequential_Applications_CVPR_2019_paper.pdf