wayne0509

@wayne0509

Joined on Mar 13, 2020

  • Resize輸入的圖到448*448 執行一個卷積神經網路 基於模型輸出的信心程度(Confidence)依據閾值和Non-max suppression得到偵測結果 YOLO用的卷積神經網路 YOLO的卷積網路架構是來自GoogleNet的模型,YOLO的網路有24卷積層(convolutional layer)和2層全連結層(fully connected layer),和GoogleNet不同的地方在於作者在某些3×3的卷積層前面用1×1的卷積層來減少filter數量,(1×1的卷積層通常拿來做降維度的作用,可以減低計算量,且不影響太多mAP)。整體架構如下圖: 卷積神經網路(Convolutional neural network, CNN): 1×1卷積計算 一般API在跑張量(tensor),通常是一個批次量的資料在執行 假設有100筆資料,每個資料都是10*10的彩色圖片(所以每個資料都是3張圖片,分別為R、G、B三張),此時的輸入資料的大小就是100 ×10 ×10 ×3,解讀方式batch ×height × width × channel,這個解讀很重要,因為除了影像的長跟寬之外,又多了兩個分別是batch和channel名詞。
     Like 1 Bookmark
  • 多層感知機是一種前向傳遞類神經網路,至少包含三層結構(輸入層、隱藏層和輸出層),並且利用到「倒傳遞」的技術達到學習(model learning)的監督式學習,以上是傳統的定義。現在深度學習的發展,其實MLP是深度神經網路(deep neural network, DNN)的一種special case,概念基本上一樣,DNN只是在學習過程中多了一些手法和層數會更多更深。 假設有個MLP的結構,共有n筆樣本,每個樣本對應m個輸出值。隱藏層只有一層設定為p個hidden node。 前向傳遞(Forward propagation): 較簡單 (只有線性合成,和非線性轉換) 反向傳遞 (Backward propagation): 較複雜 (因為多微分方程) 前向傳遞 (Forward propagation) 輸入層到隱藏層
     Like  Bookmark
  • Precision、Recall 一般深度學習看到的指標都是寫AP,AP就是average precision,指標有兩個分別為precision和recall;首先主要先理解:什麼是precision」和「什麼是recall」,和「什麼是AP」 Precision: 「所有被檢測為目標」但「正確分類為目標」的比例。[TP/(TP+FP)] Recall: 資料中的「所有目標」但「正確分類為目標」的比例。[TP/(TP+FN)] 比如說: 有個分類問題要分「狗」和「不是狗」 Precision: 所有被檢測為目標=所有被模型判斷為狗的個數 =是狗且被模型判斷為狗的個數(TP) + 不是狗且被模型判斷為狗的個數(FP)
     Like  Bookmark
  • Extra功能 追蹤運動路線,實時監測運動數據(速度、海拔、時間)、運動數據分級、準確計算卡路里燃燒及豐富的社交功能 總里程、累計用時、運動次數、步數、平均時速、GPS信號強弱顯示、空氣品質顯示 以天氣狀況作為背景圖 發現(商城、陪跑、附近的人、跑步熱點) 動作教學:跑前熱身練習、運動後拉筋、瘦小腿拉伸、跑步下肢力量增強、膝蓋力量增強 在APP上看的到別人公開的運動路線 用戶可以關注某一用戶,可以私聊某一用戶,可以查看其最近運動信息
     Like  Bookmark
  • public Mat [] thresholding(img){ Mat frame = img.rgba(); //Imgproc.cvtColor(frame, frame, Imgproc.COLOR_RGBA2GRAY); //Imgproc.Canny(frame, frame, 100, 80); //RGB灰化 //Mat copyImg = new Mat(); //frame.copyTo(copyImg, img); Imgproc.cvtColor(frame, frame,Imgproc.COLOR_BGR2GRAY);
     Like  Bookmark
  • https://www.jiqizhixin.com/articles/2017-12-17-7 https://zhuanlan.zhihu.com/p/42968117 https://fairyonice.github.io/Achieving-top-5-in-Kaggles-facial-keypoints-detection-using-FCN.html
     Like  Bookmark
  • 利用Edge Detection 跟 Line Extraction 演算法來定位出數字的位置 Line Extraction : https://www.learnopencv.com/hough-transform-with-opencv-c-python/ 將數字做字元切割和比對 https://www.itread01.com/content/1507224002.html 在圖片中判斷到信心值大於一定程度的數字後即把那個範圍做模糊或用空白覆蓋 座標處理 : https://larrymachine.blogspot.com/2019/08/opencv-contour-detection.html
     Like  Bookmark