深度學習也需要寫測試嗎? - Freddy

測試是軟體工程很重要的一環,其中單元測試尤其重要,甚至有許多因為測試而衍伸的開發模式,例如:TDD 等。然而,我們鮮少聽到有人提到深度學習模型也需要單元測試。大部分的人仰賴於 post-train 的 evaluation 去評斷模型性能的好壞,但卻忽略的模型的正確性。講者將分享,資料前處理,訓練,以及推理階段的測試。

目標聽眾

至少有跑過一次完整深度學習開發專案的開發者

先備知識

Python,以及基本的機器學習知識

歡迎大家來到SITCON 2021 ヽ(✿゚▽゚)ノ
共筆入口:https://hackmd.io/@SITCON/2021
手機版請點選上方 按鈕展開議程列表。

請從這裡開始

深度學習的開發流程

  • 資料前處理
  • 模型訓練
  • 測試效能
  • 佈署

資料前處理

  • 確保資料完整性
    • 分辨寶可夢/數碼寶貝的模型
      • 寶可夢的圖檔幾乎是 PNG
      • 數碼寶貝的幾乎是 JPEG
      • 看似模型的準確度很高,事實上受到這個變因影響
    • 資料不平均
      • under sampling
      • over sampling
      • imbalanced dataset sampler
    • 資料增強
      • 只能在 train data 使用
  • NaN/Inf 的檢查
  • 資料的分佈

有測試的深度學習開發流程

圖片來源:講者投影片

圖片來源:講者投影片

Select a repo