# 資安導論 期中分組報告 靜態分析 log > 方便最後彙整報告的LOG > 記錄實作時遇到的問題,以及如何解決。 > ## 預處理 * **剛開始無label時,討論出兩種方式實現 :** 1. 手動標label : 先手動分類出1000張左右的image,進行訓練後,再大概分出1000張左右的圖片,並以產生的結果進行剩餘圖片的分類。 2. 使用非監督式學習 : 不過效果不佳 * Kmeans : 訓練出來的模型相當於沒有訓練到  X軸為n_clusters : 找出K個分群。 Y軸為metrics.silhouette_score : 分群效果好壞的一種評價方式,以評估結果。 * DBSCAN : 灰度圖片處理有問題 * 後來改成使用moodle提供的dataset,並進行以下pre-processing。 1. 從dataset中發現圖片格式皆為.jpg,因此將我們生成的圖片格式(.png)轉為.jpg。 2. dataset的圖片size為256 * 256, 利用resize將我們生成的圖片轉為相同大小。 * **資料要normalize或標準化 :** 為了保證資料訊練時能在相同標準下進行計算,需先利用normalization優化資料的品質。 1. normalize: * cv2.normalize(img, None, 0, 1.0,cv2.NORM_MINMAX, dtype=cv2.CV_32F) 2. 標準化: * preprocessing.scale()
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up