吳家毅
    • Create new note
    • Create a note from template
      • Sharing URL Link copied
      • /edit
      • View mode
        • Edit mode
        • View mode
        • Book mode
        • Slide mode
        Edit mode View mode Book mode Slide mode
      • Customize slides
      • Note Permission
      • Read
        • Only me
        • Signed-in users
        • Everyone
        Only me Signed-in users Everyone
      • Write
        • Only me
        • Signed-in users
        • Everyone
        Only me Signed-in users Everyone
      • Engagement control Commenting, Suggest edit, Emoji Reply
    • Invite by email
      Invitee

      This note has no invitees

    • Publish Note

      Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note

      Your note will be visible on your profile and discoverable by anyone.
      Your note is now live.
      This note is visible on your profile and discoverable online.
      Everyone on the web can find and read all notes of this public team.
      See published notes
      Unpublish note
      Please check the box to agree to the Community Guidelines.
      View profile
    • Commenting
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
      • Everyone
    • Suggest edit
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
    • Emoji Reply
    • Enable
    • Versions and GitHub Sync
    • Note settings
    • Note Insights New
    • Engagement control
    • Make a copy
    • Transfer ownership
    • Delete this note
    • Save as template
    • Insert from template
    • Import from
      • Dropbox
      • Google Drive
      • Gist
      • Clipboard
    • Export to
      • Dropbox
      • Google Drive
      • Gist
    • Download
      • Markdown
      • HTML
      • Raw HTML
Menu Note settings Note Insights Versions and GitHub Sync Sharing URL Create Help
Create Create new note Create a note from template
Menu
Options
Engagement control Make a copy Transfer ownership Delete this note
Import from
Dropbox Google Drive Gist Clipboard
Export to
Dropbox Google Drive Gist
Download
Markdown HTML Raw HTML
Back
Sharing URL Link copied
/edit
View mode
  • Edit mode
  • View mode
  • Book mode
  • Slide mode
Edit mode View mode Book mode Slide mode
Customize slides
Note Permission
Read
Only me
  • Only me
  • Signed-in users
  • Everyone
Only me Signed-in users Everyone
Write
Only me
  • Only me
  • Signed-in users
  • Everyone
Only me Signed-in users Everyone
Engagement control Commenting, Suggest edit, Emoji Reply
  • Invite by email
    Invitee

    This note has no invitees

  • Publish Note

    Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note

    Your note will be visible on your profile and discoverable by anyone.
    Your note is now live.
    This note is visible on your profile and discoverable online.
    Everyone on the web can find and read all notes of this public team.
    See published notes
    Unpublish note
    Please check the box to agree to the Community Guidelines.
    View profile
    Engagement control
    Commenting
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    • Everyone
    Suggest edit
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    Emoji Reply
    Enable
    Import from Dropbox Google Drive Gist Clipboard
       Owned this note    Owned this note      
    Published Linked with GitHub
    • Any changes
      Be notified of any changes
    • Mention me
      Be notified of mention me
    • Unsubscribe
    --- tags: Connlab --- # Connlab AI ## 7/14 ### 升碩二 * 吳家毅 * 進度 * Code review of Graph2vec * 研究WL relabeling的過程 * 針對Graph2vec進行function name的改動(function replace degree) * 規劃 * 如何透過subgraph的方式去進行實作 * 適用其他的ML model驗證 * 進行維度上的參數調整 * 蔡尚洲 * 進度 * 驗證時間流不影響system tap資料集 * system tap中 EXECVE & FORK系統所產生的system call不影響data set * 規劃 * 增加data set資料 * 參加conlab IoT組meeting * 嘗試其他特徵提取方式 * 嘗試其他分類器 ### 升碩一 * 潘家洋(3041) * 正在處理作業一的部分 * 許閎量(3041) * 李弘毅作業一寫完 * 準備7/19 islab的論文報告 * 邱昱誠 * 李弘毅看完作業1的影片 * 研究作業1中 ### 升大四 #### 動態組 * 107潘瑨 * CDMC2019: word2vec + RNN 97% * 107張永承 * CDMC2019: word2vec + LSTM 90% * 預計增加LSTM層數 * 107陳彥合 * 嘗試CDMC2019: word2vec + RNN #### 靜態組 * 107梁俊彥 * 107王胤丞 * 主要在研究一些有關Graph2vec相關的部分 * WL kernel 的實做過程以及方法研究 * 研究如何使用toggdocument 去做除了doc2vec的方法 #### 未分組 * 108陳安 * 自己寫出李弘毅作業一 * 並且開始嘗試CDMC2019資料處理 ### 升大三 * 108楊奕儒 * 作業一實作,目前遇到一些卡關,正在處理中 * 108蔡芸軒 * 請假 * 108鄧宥均 * 請假 * 108林琛琛 * 請假 ## 7/21 ### 升碩二 * 吳家毅 * 進度 * 進行graph2vec參數上的調整,處理了Detection和Classification * 發現了在實作上會遇到Mirai和Bashlite之間的feature相似的問題 * 規劃 * 主要想要透過function call的關係來修正Mirai和Bashlite之間的問題 * 整理唸過的相關論文(Call_graph,graph2vec相關的論文) * 蔡尚洲 * 進度 * 規劃 ### 升碩一 * 潘家洋(3041) * 看完李宏毅的作業2影片 * 正在處理作業二的部分 * 許閎量(3041) * 7/19在islab報告GAN * 邱昱誠 * 還在看李宏毅的作業2影片 ### 升大四 #### 動態組 * 107潘瑨 * CDMC2019: word2vec + RNN 97% * 和永承一起弄LSTM 或 RNN * 107張永承 * CDMC2019: word2vec + LSTM * 之前LSTM參數使用錯誤 * 改進後發現LSTM要帶入word2vec的參數 * 107陳彥合 * 嘗試CDMC2019: word2vec + SVM 0.97 * word2vec 一個system call 100維 * 但把一個file內的system call vector 取平均值 當作input #### 靜態組 * 107梁俊彥 * 107王胤丞 * 主要 #### 未分組 * 108陳安 * 作業一訓練資料輸入錯誤 * 繼續嘗試 ### 升大三 * 108楊奕儒 * 實做出作業1 * 但準確率不太好 * dataset前處理出問題 * 正規化出問題 * 108蔡芸軒 * 看完Regression的影片 * 在寫作業1 * 有手刻Regression * 誤差值10以內 * 額外用xgb_regression實作 * 有丟kaggle * 108鄧宥均 * 還沒進群組 * 108林琛琛(嗔) * 還沒進群組 ## 7/28 ### 升碩二 * 吳家毅 * 進度 * 進行參數上的調整以及對於資料正確性做判別 * 判斷Mirai和Bashlite之間的差異 * 在Classification達到97-98的準確率以及f1-score. * 規劃 * 判斷是否能夠更加改善Mirai和Bashlite的差異已達到99 * 蔡尚洲 * 進度 * 報告 : Does Every Second Count? Time-based Evolution of Malware Behavior in Sandboxes * 班嗓覺得這篇分析方式很不錯 * 規劃 * 針對WINDOWS和IOT之間的差異進行研究 * IOT大部分會進行網路連結 * 所以要可以在內網內行網路通訊(這個環境的建構是我們實驗室資料集的侷限性) ### 升碩一 * 潘家洋(3041) * 正在看CNN的影片 * 處理作業二的部分 * 準備弄CDMC2019 * 許閎量(3041) * 看對抗式攻擊 * 邱昱誠 * 看完CNN的影片 * 開始做作業1 ### 升大四 #### 動態組 * 107潘瑨 * embedding 加入0向量 * CDMC2019: word2vec + LSTM 99% * 查證word2vec的三個參數 * 107張永承 * 一起弄 CDMC2019: word2vec + LSTM * 論文的,GRU,他們兩個一起的 總共三個MODEL * 0.88,0.95,0.98 * 跟上次的差別 * 上次LABEL方式錯誤 * 架構沒變 * 只改動每層內的神經元數量 * 改進 * 取sample前半段 * 改動feature vecter維度 #### 靜態組 * 107梁俊彥 * 107王胤丞 * 研究和wl kernel iteration2之運作,觀察是否可以透過跳過skipgram的方式來達到更好的效能 * 目前遇到資料量太大的問題,仍在思考如何做feature selection #### 未分組 * 108陳安 * 請假 AIS3 * 107陳彥合 * 打AZ身體不舒服 - CDMC2019 RT 98% - TF-IDF需要在熟悉 - cross-validation ### 升大三 * 108楊奕儒(動態組) * 後來發現是之前test data處理錯誤 * 有些feature是會混淆分析,需要剔除 * 開始弄作業2 * 108蔡芸軒 * 看完classification的影片 * 在寫作業2 * 有手刻Regression,機率generative model,KNN,SVM * 接下來要看CNN之前的影片 * 108鄧宥均 * 還沒進群組 * 108林琛琛(嗔) * 還沒進群組 ## 8/3 ### 升碩二 * 吳家毅 * 進行參數上的調整以及修正誤判的情形。再classification達到0.98,detection達到0.99的成果 * 將更仔細的統整實驗報告,以及實驗流程及目的與班桑討論. * 蔡尚洲 ### 升碩一 * 潘家洋(3041) * system call & API call * 搞懂動態在幹嘛 * 許閎量(3041) * 看林軒田的線上課程 * 開始處理CDMC2019 * 邱昱誠 * 寫作業1 * 有找到改進版 * 開始自己寫Code ### 升大四 #### 動態組 * 107潘瑨 * 查證word2vec的三個參數 * CHUN建議 : 正則表達式 & nltk * 107張永承 * 只拿前面50000 padding 400 99.0% * 接下來遞減取system call的長度 #### 靜態組 * 107梁俊彥 * 107王胤丞 * 進行graph2vec的參數調整(dim,epoch,iteration...) * 嘗試修正wl kernel iteration2之實驗結果,使用hashveectorization解決維度太大的問題 #### 未分組 * 108陳安 * CDMC 2019 準備訓練 * 107陳彥 * CDMC2019 RT 98% * cross-validation 確認大小寫沒差 * TF-IDF 著重在類別1跟2 ### 升大三 * 108楊奕儒(動態組) * 開始弄作業2 * 差在最後的generation的比較 * 108蔡芸軒 * 作業3 debug * 108鄧宥均 * 影片看完作業2以前的影片的 * 108林琛琛(嗔) * 看完gradient descent ## 8/11 ### 升碩二 * 吳家毅 * 完成後續實驗(分CPU去進行training,parameter training,UMAP 2D visualization等等) * 蔡尚洲 * 規劃 * 重新建system call table : 怕有遺漏的 * 把CPU架構加入考量 * **strace & system tap 要在同一data set上做比較** ### 升碩一 * 潘家洋(3041) * CDMC2019 word2vec LSTM 1 layer 95% * word2vec CNN 3 layer 97% * 至少提到98% * 許閎量(3041) * CDMC2019 freq 121*1 98.8 * 試CNN & n-gram * 邱昱誠 * 熟悉python * 立宇 * ### 升大四 #### 動態組 * 107潘瑨 * 請假 看醫生 * 107張永承 * 只拿前面50000 padding 400 99.0% * 在10000-15000左右 * 用現有的方式 測試新的system tap的其中10000 #### 靜態組 * 107梁俊彥 * 107王胤丞 * 持續研究和graph2vec relabeling的部分,是否能夠改善時間的部分 * hash verctor * 進行參數上的試驗 #### 未分組 * 108陳安 * CDMC 2019 準備訓練 * 正在feature selection的部分 * 用frequence * 107陳彥合 * CDMC2019 RT 98% * 逐一看每個system call的功能是否相似 然後把一樣功能的system call改成同一個(統一他) * 但成功率下降到97 * 還有看五個類別個別獨有的system call有哪些 ### 升大三 * 108楊奕儒(動態組) * 作業2找出 logistics regression這個方法是比較好了 * 並超過based line * 接著CDMC * 108蔡芸軒 * 作業3 改用數字28*28 dataset做 * 三層的CNN 98.8% * 接著CDMC * 108鄧宥均 * 身體不舒服 請假 * 108林琛琛(嗔) * 看完作業2影片 * 看懂作業1的code * 熟悉python ## 8/18 ### 升碩二 * 吳家毅 * 完成後續實驗(分CPU去進行training,parameter training,UMAP 2D visualization等等) * 進行參數上的調整,以及完成實驗結果的表格 * 蔡尚洲 * 規劃 * 重新建system call table : 怕有遺漏的 * 把CPU架構加入考量 * **strace & system tap 要在同一data set上做比較** ### 升碩一 * 潘家洋(3041) * 請假 * 許閎量(3041) * CDMC2019 freq 121*1 98.8 * 試CNN & n-gram * 邱昱誠 * 自己寫完作業1 * 寫作業2 ### 升大四 #### 動態組 * 107潘瑨 * 針對LSTM一次塞入的sequence的長度對運算時間和準確率的影響 * ![](https://i.imgur.com/D9UQEw5.png) * 107張永承 * 用現有的方式 測試新的system tap的其中10000 * 前30000 * LSTM 從 3 lyaer 增加到 5 layer #### 靜態組 * 107梁俊彥 * 107王胤丞 * 研究了WL relabeling的paper並且研究了這些relabeling所代表的意義 * 探討了實作方法和graph2vec進行比較時間,發現時間上的提升。 #### 未分組 * 108陳安 * CDMC 2019 97% * 研究用0或-1表示system call沒有出現對於模型的影響 * 要用的模型svm knn RT * 107陳彥合 * CDMC2019 RT 98.28% * 針對相似的system call進行研究 ### 升大三 * 108楊奕儒(動態組) * CDMC 資料讀取 * 108蔡芸軒 * 請假 * 108鄧宥均 * 作業1跑起來 * 接下來自己寫code * 108林琛琛(嗔) * 作業2寫完 ## 8/25 ### 升碩二 * 吳家毅 * 實驗大致完成,目前正在撰寫文章。 * 蔡尚洲 * 在同一dataset上比較 s trace & system tap * 成功率都只有86% * 針對system call sequence過短的檔案 * 在兩個沙箱個別的情況 * 分別在哪些家族 * 給IoT組回饋 * 過短的原因 * 什麼情況會停止(system call) ### 升碩一 * 潘家洋(3041) * 請假 * 許閎量(3041) * CDMC2019 freq 121*1 98.8 * 試CNN & n-gram * 邱昱誠 * 寫作業2 * 立宇 * 影片看到作業1完 * 作業1 ### 升大四 #### 動態組 * 107潘瑨 * 107張永承 * system tap 19000 * word2vec LSTM 5 layer * accuracy : 30% 而已 * 都分類到其中一個類別 , 可能是無效資料的影響 * 107陳彥合 * CDMC2019 RT 98.28% * 針對相似的system call進行研究 * 每個system call在各個類別的比較 #### 靜態組 * 107梁俊彥 * 107王胤丞 * 探討了實作方法和graph2vec進行比較資料集。 * 測試了iter1,iter+func之間的成果差別, * 進行參數上的調整 #### 未分組 * 108陳安 * CDMC 2019 97% * RT count 98% ### 升大三 * 108楊奕儒(動態組) * 了解word2vec * 108蔡芸軒 * 請假 * 108鄧宥均 * 作業1自己寫過一遍 * 108林琛琛(嗔) * 把CNN影片看完 * 作業2看懂 ## 9/1 ### 升碩二 * 吳家毅 * 撰寫文章。 * 蔡尚洲 * dataset有很多重複的data,必須處理這塊 * 調查重複的sequence(system call)是否屬於同一個類別 * 可能與crash的點有關,到同一個點crash後,會導致資料集重複,但可能不是屬於同一種class,因此不管怎樣都不可能分類正確。 * 調查該數據集 * 在準確度到99後開始思考創新性,改善了些什麼和先前不同的。 * label有衝突的sequence可能集中在某一個段上。 * 先把unique的sequence拿出來討論 ### 升碩一 * 潘家洋(3041) * CNN 層數3以上準確率下降 * 看gated-CNN * 開始做CDMC 2020 * 許閎量(3041) * CDMC2019 n-gram + RT + 10-cross 0.984 * 開始做CDMC 2020 * 邱昱誠 * 寫作業2 * 立宇 * 請假 ### 升大四 #### 動態組 * 107潘瑨 * 107張永承 * system tap 19000 * word2vec LSTM 5 layer * accuracy : 30% 而已 * 都分類到其中一個類別 , 可能是無效資料的影響 * 107陳彥合 * CDMC2019 RT 98.28% * slectfrommodel看feature的重要值 0.984 * 把同類別同seq只留下一個 避免OVERFITTING * 把不同類別同seq都刪掉 * 0.987 #### 靜態組 * 107梁俊彥 * 107王胤丞 * 探討了實作方法和graph2vec進行比較資料集。 * 測試了iter1,iter+func之間的成果差別, * 進行參數上的調整 #### 未分組 * 108陳安 * 報告3-4章 ### 升大三 * 108楊奕儒(動態組) * 了解word2vec * 108蔡芸軒 * CDMC2019檔案處理完成 * 準備用word2vec + 機器學習 * 108鄧宥均 * 作業1自記寫過一遍 * 108林琛琛(嗔) * 作業2寫完 * 開始CDMC2019 ## 9/8 ### 後門 - 永承 潘靜 閎量 家洋 立宇 昱誠 - LRP : 閎量 家洋 小穹妹 (家毅) - ABS : 立宇 昱誠 永承 (尚洲) - pickle : 待定 ### sandbox - 彥和 胤承 俊彥 文彥(IoT) - 討論兩組合併的討論時間 ### 升碩二 * 吳家毅 * 研究GNN,以及classfication和cross-platform * 蔡尚洲 * dataset有很多重複的data,必須處理這塊 * 調查重複的sequence(system call)是否屬於同一個類別 * 可能與crash的點有關,到同一個點crash後,會導致資料集重複,但可能不是屬於同一種class,因此不管怎樣都不可能分類正確。 * 調查該數據集 * 在準確度到99後開始思考創新性,改善了些什麼和先前不同的。 * label有衝突的sequence可能集中在某一個段上。 * 先把unique的sequence拿出來討論 ### 升碩一 * 潘家洋(3041) * CNN 層數3以上準確率下降 * 看gated-CNN * 開始做CDMC 2020 * 許閎量(3041) * CDMC2019 n-gram + RT + 10-cross 0.984 * 開始做CDMC 2020 * 邱昱誠 * 寫完作業2 * 看完CNN影片 * 接CDMC2019 * 立宇 * 下禮拜 寫作業2完 看完CNN的影片 * 馬順哲 ### 升大四 #### 動態組 * 107潘瑨 * 107張永承 * 107陳彥合 * CDMC2019整支的sequence一樣且存在不同label的 * 砍掉數量較少的那一方 * 99.1% * 做strace22000 就有檔名可以和靜態比較seq重複的部分 #### 靜態組 * 107梁俊彥 * 107王胤丞 * 進行參數上的處理(grid search),並且整理了暑期的進度,實作過程等.. #### 未分組 * 108陳安 * 請假 ### 升大三 * 108楊奕儒(動態組) * 了解word2vec * 108蔡芸軒 * CDMC2019檔案處理完成 * 用word2vec + CNN 記憶體爆掉 * 先用機器學習看word2vec有沒有出錯 再套CNN * 108鄧宥均 * 作業2寫完 * 接下來看完CNN影片 * 做CDMC2019 * 108林琛琛(嗔) * 請假 ## 9/15 ### 後門 - 永承 潘靜 閎量 家洋 立宇 昱誠 - LRP : 閎量 家洋 小穹妹 (家毅) - ABS : 立宇 昱誠 永承 (尚洲) - pickle : 待定 ### sandbox - 彥和 胤承 俊彥 文彥(IoT) - 討論兩組合併的討論時間 ### 升碩二 * 吳家毅 * 內容: * 先前實驗建立在偵測 * 做了分類(malware classification) * ![](https://i.imgur.com/bDK2RGK.png) * based on之前graph2vec的方法 * dim : feature vector dimension * 家族資料太少:去除 * 最高到98% * 用CPU架構下 * user design function要去處理,看能不能提高分類ACC * 做clustering將相似的重新整理 * 班桑建議: * 不管怎麼處理都會有**不包含分類訊息**的訊息 , 可以用一些方法去除 * 應該關注在錯誤分類的樣本,去思考分類錯誤的原因,才能提高精度(細節) * 不需要太去注意**綜合資料** * 可以用機器學習的方式去篩選可用特徵 * 蔡尚洲 * 班桑建議: * 如何利用Strace和System tape 共同使用? * 應探討兩個系統產生之特徵差異 * 需要有一些創新性,不只是單純將兩個dataset放入分類器進行分類 * 不要花太多時間在數據處理 * 計畫: * 將兩dataset各個label的特徵進行比較 找出兩dataset差異 * GSDroid、sequence、system call frequence * 比較兩platform的**過短**檔案分別是哪些類別(是否重複 * 比較兩platform的**重複**檔案分別是哪些類別(是否重複 * 兩platform有效檔案中分類錯誤的malware是否可以互相彌補 ### 升碩一 * 潘家洋(3041) * 做CDMC 2020 資料不知道怎麼處理 * 許閎量(3041) * CDMC 2020 3-gram 97% * 邱昱誠 * 在弄CDMC2019 * 立宇 * 不在 準備請飲料 * 馬順哲 * 看完作業1 * 家毅學長很嚴格 * 正在做作業2 ### 升大四 #### 動態組 * 107潘瑨 * 107張永承 * 107陳彥合 * CDMC2019整支的sequence一樣且存在不同label的 * 都砍掉的結果比砍掉數量較少的那一方低一點點 * CDMC2020 97% #### 靜態組 * 107梁俊彥 * 107王胤丞 * 進行參數上的處理(grid search),並且整理了暑期的進度,實作過程等.. #### 未分組 * 108陳安 * 報告第5章 ### 升大三 * 108楊奕儒(動態組) * CDMC2019 用特別的方式 資料餵不進模型 * 108蔡芸軒 * CDMC2019檔案處理完成 * 用word2vec 機器學習 95% * word2vec model放到CNN外面 * 108鄧宥均 * 請假 * 108林琛琛(嗔) * strace22000 freq as feature , random forest:99.9 * cross 混淆矩陣 ## 9/22 ### 後門 - 永承 潘靜 閎量 家洋 立宇 昱誠 - LRP : 閎量 家洋 小穹妹 (家毅) - ABS : 立宇 昱誠 永承 (尚洲) - pickle : 待定 ### sandbox - 彥和 胤承 俊彥 文彥(IoT) - 討論兩組合併的討論時間 ### 升碩二 * 吳家毅 * 內容: * 針對分類錯誤的data進行分析 * train : test = 8:2 * 查看分類錯誤檔案內部架構 * 海嘯分類錯誤原因 * 產生callgraph時,user define function 在relabel時很難轉成feature * 因為user define function占比太高導致分類到前幾類的類別 * 把user define function但比過高的sample先拿掉 * ACC從97增長到98.1左右 * 是有幫助分類的 * 班桑建議: * 找出被分類錯誤的決定性因素 * 蔡尚洲 * 班桑建議: * 如何利用Strace和System tape 共同使用? * 應探討兩個系統產生之特徵差異 * 需要有一些創新性,不只是單純將兩個dataset放入分類器進行分類 * 不要花太多時間在數據處理 * 計畫: * 將兩dataset各個label的特徵進行比較 找出兩dataset差異 * GSDroid、sequence、system call frequence * 比較兩platform的**過短**檔案分別是哪些類別(是否重複 * 比較兩platform的**重複**檔案分別是哪些類別(是否重複 * 兩platform有效檔案中分類錯誤的malware是否可以互相彌補 ### 升碩一 * 潘家洋(3041) * 做CDMC 2020 資料不知道怎麼處理 * 許閎量(3041) * backdoor正規化後似乎比較難攻擊,汙染筆數可能要增加 * 邱昱誠 * 在弄CDMC2019跟backdoor * 立宇 * 寫完作業2 * 馬順哲 * 李宏毅的都好了 ### 升大四 #### 後門組 * 107潘瑨 * 107張永承 #### 沙箱組 * 107陳彥合 * 弄IOT組產生的STRACE LOG轉成system call sequence * 107梁俊彥 * 107王胤丞 * 進行參數上的處理(grid search),並且整理了暑期的進度,實作過程等.. #### 未分組 * 108陳安 * 報告第5章 ### 升大三 * 108楊奕儒(動態組) * CDMC2019 用特別的方式 資料餵不進模型 * 108蔡芸軒 * CDMC2019 word2vec model放到CNN外面 * 建議用doc2vec去train不同長度的system call sequence * 108鄧宥均 * CDMC2019 用KNN 47% * 特徵提取出問題 * 108林琛琛(嗔) * strace22000 freq as feature , random forest:99.9 * cross 混淆矩陣 ## 9/27 ### 後門 - 永承 潘靜 閎量 家洋 立宇 昱誠 - LRP : 閎量 家洋 小穹妹 (家毅) - ABS : 立宇 昱誠 永承 (尚洲) - pickle : 待定 ### sandbox - 彥和 胤承 俊彥 文彥(IoT) - 討論兩組合併的討論時間 ### 升碩二 * 吳家毅 * 內容: * 針對分類錯誤的data進行分析 * train : test = 8:2 * 查看分類錯誤檔案內部架構 * 海嘯分類錯誤原因 * 產生callgraph時,user define function 在relabel時很難轉成feature * 因為user define function占比太高導致分類到前幾類的類別 * 把user define function但比過高的sample先拿掉 * ACC從97增長到98.1左右 * 是有幫助分類的 * 班桑建議: * 找出被分類錯誤的決定性因素 * 蔡尚洲 * 班桑建議: * 如何利用Strace和System tape 共同使用? * 應探討兩個系統產生之特徵差異 * 需要有一些創新性,不只是單純將兩個dataset放入分類器進行分類 * 不要花太多時間在數據處理 * 計畫: * 將兩dataset各個label的特徵進行比較 找出兩dataset差異 * GSDroid、sequence、system call frequence * 比較兩platform的**過短**檔案分別是哪些類別(是否重複 * 比較兩platform的**重複**檔案分別是哪些類別(是否重複 * 兩platform有效檔案中分類錯誤的malware是否可以互相彌補 ### 升碩一 * 潘家洋(3041) * 做CDMC 2020 資料不知道怎麼處理 * 許閎量(3041) * backdoor正規化後似乎比較難攻擊,汙染筆數可能要增加 * 邱昱誠 * 在弄CDMC2019跟backdoor * 立宇 * 寫完作業2 * 馬順哲 * 李宏毅的都好了 ### 升大四 #### 後門組 * 107潘瑨 * 107張永承 #### 沙箱組 * 107陳彥合 * 弄IOT組產生的STRACE LOG轉成system call sequence * 107梁俊彥 * 107王胤丞 * 進行參數上的處理(grid search),並且整理了暑期的進度,實作過程等.. * #### 未分組 * 108陳安 * 物件偵測 ### 升大三 * 108楊奕儒(動態組) * CDMC2019 LSTM 97% * 108蔡芸軒 * CDMC2019 LSTM 90% * 108鄧宥均 * CDMC2019 freq RT 98.2 * 108林琛琛(嗔) * strace22000 freq as feature , random forest:99.9 * cross 混淆矩陣 * CDMC2020 byte sequence 96-98 ## 10/18 ### 升碩二 * 吳家毅 * 蔡尚洲 ### 升碩一 * 潘家洋(3041) * 許閎量(3041) * 邱昱誠 * 立宇 * 馬順哲 ### 升大四 #### 後門組 * 107潘瑨 * 107張永承 #### 沙箱組 * 107陳彥合 * 107梁俊彥 * 107王胤丞 * 包裝檢測model,以及處理testing 錯誤資料。 #### 未分組 * 108陳安 ### 升大三 * 108楊奕儒(動態組) * cdmc 2021 task1 * 108蔡芸軒 * cdmc 2021 task1 * 處理成fixed-sized * 108鄧宥均 * CDMC 2021 task1 * 108林琛琛(嗔) * paper ## 10/25 ### 升碩二 * 吳家毅 * 蔡尚洲 ### 升碩一 * 潘家洋(3041) * 許閎量(3041) * 邱昱誠 * 立宇 * 馬順哲 ### 升大四 #### 後門組 * 107潘瑨 * 107張永承 #### 沙箱組 * 107陳彥合 * 107梁俊彥 * 107王胤丞 * 檢測實體設備上的實驗結果,以及處理一下實體設備上遇到的問題(準確度較低的部分)。 #### 未分組 * 108陳安 ### 升大三 * 108楊奕儒(動態組) * cdmc 2021 task1 * 108蔡芸軒 * cdmc 2021 task1 * 處理成fixed-sized * 108鄧宥均 * CDMC 2021 task1 * 108林琛琛(嗔) * paper

    Import from clipboard

    Paste your markdown or webpage here...

    Advanced permission required

    Your current role can only read. Ask the system administrator to acquire write and comment permission.

    This team is disabled

    Sorry, this team is disabled. You can't edit this note.

    This note is locked

    Sorry, only owner can edit this note.

    Reach the limit

    Sorry, you've reached the max length this note can be.
    Please reduce the content or divide it to more notes, thank you!

    Import from Gist

    Import from Snippet

    or

    Export to Snippet

    Are you sure?

    Do you really want to delete this note?
    All users will lose their connection.

    Create a note from template

    Create a note from template

    Oops...
    This template has been removed or transferred.
    Upgrade
    All
    • All
    • Team
    No template.

    Create a template

    Upgrade

    Delete template

    Do you really want to delete this template?
    Turn this template into a regular note and keep its content, versions, and comments.

    This page need refresh

    You have an incompatible client version.
    Refresh to update.
    New version available!
    See releases notes here
    Refresh to enjoy new features.
    Your user state has changed.
    Refresh to load new user state.

    Sign in

    Forgot password

    or

    By clicking below, you agree to our terms of service.

    Sign in via Facebook Sign in via Twitter Sign in via GitHub Sign in via Dropbox Sign in with Wallet
    Wallet ( )
    Connect another wallet

    New to HackMD? Sign up

    Help

    • English
    • 中文
    • Français
    • Deutsch
    • 日本語
    • Español
    • Català
    • Ελληνικά
    • Português
    • italiano
    • Türkçe
    • Русский
    • Nederlands
    • hrvatski jezik
    • język polski
    • Українська
    • हिन्दी
    • svenska
    • Esperanto
    • dansk

    Documents

    Help & Tutorial

    How to use Book mode

    Slide Example

    API Docs

    Edit in VSCode

    Install browser extension

    Contacts

    Feedback

    Discord

    Send us email

    Resources

    Releases

    Pricing

    Blog

    Policy

    Terms

    Privacy

    Cheatsheet

    Syntax Example Reference
    # Header Header 基本排版
    - Unordered List
    • Unordered List
    1. Ordered List
    1. Ordered List
    - [ ] Todo List
    • Todo List
    > Blockquote
    Blockquote
    **Bold font** Bold font
    *Italics font* Italics font
    ~~Strikethrough~~ Strikethrough
    19^th^ 19th
    H~2~O H2O
    ++Inserted text++ Inserted text
    ==Marked text== Marked text
    [link text](https:// "title") Link
    ![image alt](https:// "title") Image
    `Code` Code 在筆記中貼入程式碼
    ```javascript
    var i = 0;
    ```
    var i = 0;
    :smile: :smile: Emoji list
    {%youtube youtube_id %} Externals
    $L^aT_eX$ LaTeX
    :::info
    This is a alert area.
    :::

    This is a alert area.

    Versions and GitHub Sync
    Get Full History Access

    • Edit version name
    • Delete

    revision author avatar     named on  

    More Less

    Note content is identical to the latest version.
    Compare
      Choose a version
      No search result
      Version not found
    Sign in to link this note to GitHub
    Learn more
    This note is not linked with GitHub
     

    Feedback

    Submission failed, please try again

    Thanks for your support.

    On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?

    Please give us some advice and help us improve HackMD.

     

    Thanks for your feedback

    Remove version name

    Do you want to remove this version name and description?

    Transfer ownership

    Transfer to
      Warning: is a public team. If you transfer note to this team, everyone on the web can find and read this note.

        Link with GitHub

        Please authorize HackMD on GitHub
        • Please sign in to GitHub and install the HackMD app on your GitHub repo.
        • HackMD links with GitHub through a GitHub App. You can choose which repo to install our App.
        Learn more  Sign in to GitHub

        Push the note to GitHub Push to GitHub Pull a file from GitHub

          Authorize again
         

        Choose which file to push to

        Select repo
        Refresh Authorize more repos
        Select branch
        Select file
        Select branch
        Choose version(s) to push
        • Save a new version and push
        • Choose from existing versions
        Include title and tags
        Available push count

        Pull from GitHub

         
        File from GitHub
        File from HackMD

        GitHub Link Settings

        File linked

        Linked by
        File path
        Last synced branch
        Available push count

        Danger Zone

        Unlink
        You will no longer receive notification when GitHub file changes after unlink.

        Syncing

        Push failed

        Push successfully