# 碩論 (2021/7/9) 口試 yin ###### tags: `碩論地獄` 19m11s進實驗 29m37s全部 king of oral exam ## yin ## gu ###### 高 做的內容相當不錯 37頁中間的過程,relu跟pool的順序不一致,是不是沒有影響 虛線箭頭指的意思是什麼,建議改成實現(虛線一班是做很多次) 47頁前面幾個滿少的,sql injection增量後可以多少,那testing部分是多少。 增量是如何做增量 舉例來說是sql injection兩個封包取中間,那意義上是什麼,28是取全部來做還是部分,做完的結果是還在原本樣本附近,類似內差運算(不知道對ㄅ對) 兩個重點,演算法正確跟data海量,雖然你有做增量,但還是圍繞在有限的dataset,那overfitting的狀況沒辦法改善,有點可惜量很少。但這困難度比較高,我可以理解。基礎的量再多一點,model會比較好。 ###### 吳 50頁,這三個比較差,原因在剛剛的47頁,你是用聚合方式讓效果比較漂亮,那原因跟資量料少有關係,你用增量的方式會有overtraining的現象,建議可以收集多一點資料,把這三種區分開,那這樣就很漂亮 31頁底下在論文中沒有 28頁在論文也沒有,不知道是不是有對加密資料做處理,投影片放盡論文中 你的題目是用flow based,你的題目是加密流量,但也可以針對不加密的流量偵測出是否惡意,那是不是要把加密放上題目,因為不會侷限在加密。 或在結論可以加強說明針對非加密的流量。 老師開吹,請筱茵特別強調混合流量,筱茵已經變成老師親女兒了。 ## yen˙ ###### 高 * 這個題目是非常有趣,從來沒想過加密的內容也可以偵測出來 * access確定(? * ppt37,中間的過程relu跟pool這個部分,你的文字是說先說pool在做relu(?,但你這邊的圖好像不一致 * 還有虛線箭頭是什麼意思? * 我建議是直接改成直線,虛線會讓人誤解 * ppt47,這個部分,其實蠻明顯的,sqli xss..的量是相對比較少的,那像sqli增量之後是多少呢? * 那testing的量是多少? * 你增量再說明一次,剛剛說太快了 * 那舉例來說,像sqli在增量上的封包的意義是什麼呢? * 那做完的結果,是不是還是會在這些樣本的附近? * 那基本上我是建議啦,這樣的方式看起來還可以,只是說最理想的,像cnn這種,基本上就是演算法要正確跟data 嘴們(?....,overfitting基本上應該是不會有太大的改善。我是覺得有點可惜啦,基本的量應該是不要太少比較少,一般來說量應該是上萬筆,我也知道這個部分的困難度是比較高,這部分的收集難度是比較高的,這是個建議啦,基礎的量要更多一點,對於training會比較好,如果是用增量出來的,可信度可能會降低一些些,這是個建議。 * 其他我就沒問題。 ###### 吳 * 我這邊提兩三個小問題,我的問題跟高博士基本上是依樣的問題 * p48,就中間這個地方,就這三個比較差嗎,原因就在於剛剛的p47,剛剛資料量比較少,你剛剛是用具和的方式,讓他呈現方式比較漂亮,原因跟剛剛高博士講的依樣,就是資料比較少的方式,用增量的方式導致有overtraining,所以我這邊的建議是去收集更多的資料,把這三個區分開來,其他的事都很不錯啦。 * p31,底下那個部分,在你的論文沒有。 * p28(動畫),這張在你的論文裡面也沒有,我不知道你到底有沒有針對加密的資料做處理? * 把它放到論文去比較好 * 你的題目,“流量加密的研究”,事實上沒有加密的也可以偵測出來,所以你的題目到底要不要把“加密”放上去?我想你現在也不能改題目了啦,但其實依你的正常的流量也是沒有加密的,事實上你也都放到你的training data上面去了,所以你也不用限制題目只有“加密”流量啦。 * 沒有其他問題了。 * 但你可以在結論,說明一下“非加密”流量依樣可以偵測出來的。 老師吹起來,“加密”是小音說“很難的”所以才寫上去,所以我會請小茵在摘要啦結論啦,說明“加密”“非加密”“混合”都可以適用