# 實驗 - 我們想測試在說相同密碼的情況下,input的data越清晰越好,還是符合training data的畫素,哪一個的效果比較好。 input 畫素360*288 辨識度:0.81  input 畫素640*480 辨識度:0.78  input 畫素720*540 bin blue at A nine again 辨識率:0.94  ----------- 密碼相同:set red in k eight now - input 畫素360*288 辨識度:0.66  - input 畫素640*480 辨識度:0.77  - input 畫素720*540 辨識率:0.36  - 結論: 脣形影響辨識正確率結果較大,畫質因素影響較小 # 困難點 ## 1. 解決讀取影片的延遲 - Main - 辨識人臉 - 開第二個thread專門處理影片read&write ## 2. 如何正確餵進去model所需要的input **Model's Input 為 100*50 整體嘴唇圖片** - 程式碼裁切嘴巴的圖片格式為100\*50,但是因為我們講完密碼後,最後一秒嘴巴會撇開鏡頭,導致最後一秒抓不到嘴巴。而Model只要沒偵測到嘴巴,會return原本照片的畫素640*480,導致Input為[100\*50, 100\*50, ............. 640\*480],因此,更改CODE,model如果沒偵測到嘴巴依然傳入100\*50照片 ## 3. 解決將avi自動轉檔成mpg FFmpeg是手動輸入cmd來達成轉檔功能,我們嘗試用subprocess實現自動裁切成需要的格式 ## 4. 32bit轉64bit後picamera無法使用 picamera module 無法使用,改用cv2 module讀取影像資訊 ## 5. 無法符合理想中的準確率 可能是因為我們是非母語者,所以辨識出的結果沒辦法一模一樣(100%),所以從三種function中選擇以Levenshtein模組算出字串相似度來做為解鎖的依據。 ## 6. 論文理解深度不足 由於我們的知識與經驗不足,因此在理解SPATIOTEMPORAL CONVOLUTIONS、GATED RECURRENT UNIT和CONNECTIONIST TEMPORAL CLASSIFICATION時無法完整的釐清他們的input data、output data和model中的理論部分,只能大概理解這三個model的功能
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up