owned this note
owned this note
Published
Linked with GitHub
---
title: Lab Meeting Minutes 2020/07/28
tags: lab_meeting, 1091
---
> - [Meeting Regulation](http://ms11.voip.edu.tw/~manager/HOWTO/SOP/SOP-0014.php)
>---
>Outline
>[TOC]
---
# PEARL Lab Meeting
- 時間:109年7月28日(Tue) 19:00
- 地點:暨南大學科三321教室
- 主講人:謝萬霖
- 出席者:吳坤熹老師(遠距)、謝萬霖、黃晨瑋、劉又聖、劉怡君、田蕙瑜、陳嘉瑋(遠距)
- 會議主題:[Line-based Anomaly Detection](http://ms15.voip.edu.tw/~edgar/Meeting/line-based_anomaly_detection_v2.pptx)
## 會議內容
- 異常偵測:
- 特定行為模式
- 機器學習分析
- 圖形理論分析(本次報告重點)
- 從**道路分析**延伸至**網路分析**: 本次論文雖著重在道路資料的收集及偵測,
- 本篇論文應用在網路上的問題&延伸
- 嘗試將此偵測方法應用在網路環境
- 網路連線不像道路永久存在
- 封包流量變化大,不易指定臨界值
- 可行的改進方向
- 改為 vertex-based
- 關心封包流量 -> 連線數量
## 問題討論
- 論文中的「圖形」,英文是 pattern 還是 graph? [name=Solomon]
- 沒有明確寫 graph 這個字,但它主要談的是 vertex 和 edge, 所以我很確定是 graph。 [name=Edgar]
- 將論文內容套用到網路上時提出兩點改進方向,學長對於目前這兩點的相關研究進展如何?[name= 又聖]
- 改為 vertex-based
- 關心封包流量 -> 連線數量
- 暫時還在規劃程式
- p.10 不同道路速度差的計算及道路狀況更新觀念澄清 [name= 又聖]
- P.10 的速度是只看AM, 還是 AM+PM的平均值 [name= Angela]
- 我(萬霖)只看AM, 因為PM都差不多.
- P.10 可否用個具體的例子,告訴我們如何從 1 變到 1.9, 再變到2.7? [name=Solomon]
- 我們看edge 1和edge2, 變到Day 2時它們還是相似,reward = $\alpha_1$ ** 1 = 0.9, 所以新的值是 1 + 0.9 = 1.9
- 而 edge 1 和 edge 2 變到 Day 3 時他們相差超過5了,penalty = 𝛽 ** 1.9 = 1.2, 所以新的值是 1.9 - 1.2 = 0.7
- 這裡你就可以看出他不是取AM+PM的總和或平均,因為從Day 2到Day 3時,AM+PM的總和與平均都小於5。所以*作者也只有取AM*。他真應該刪掉PM那欄,以免混淆。 :frowning:
- 道路是看車速, 網路上是怎麼量測 [name= Angela]
- 封包數 * 大小 [name= Edgar]
- Actually, I think you can directly get the number of bytes from SNMP. See [this document](https://www.cisco.com/c/en/us/support/docs/ip/simple-network-management-protocol-snmp/8141-calculate-bandwidth-snmp.html). [name=Solomon] :+1:
- 應用在道路分析上,流量分析有麼優缺點?[name= Abner]
- 附近區域道路狀況。可以看上班期間道路較繁忙等等。
- 優點: 能知道該條道路狀況,壅塞與否?有無車禍等意外狀況發生
- 離群值大概多少代表有問題? [name= 嘉瑋]
- 論文中沒有明確寫出來。可能要依經驗來決定該設多少。[name=Edgar]
- 新的研究趨勢是不要設一個固定的threshold,而是用人工智慧的方法adaptively動態調整。[name=Solomon]
#### 建議
1. 若在報告他人論文中間, 有額外補充說明或發表個人意見時,需註明清楚。不要把你個人的意見和作者寫在論文中的內容混在一起講。 [name= Prof Solomon]
2. 簡報技巧:一致性。名詞需前後一致,不要第8頁叫「臨界值」,第10頁改稱 𝜃;這樣聽眾很容易覺得是兩個不同的東西。例子最好從頭貫串到尾,今天第10頁的edge例子和第6頁的例子如果用同一個圖,聽眾在理解上就不致遭遇那麼多困難。 [name= Prof Solomon]
4. 第7頁的「指定步數內的neighbor」,雖然論文中有「3步內的neighbor」,但今天要報告的部分如果只用到「直接相連的neighbor」,建議今天就只講最簡單的定義就好。講太多,造成大家疑惑,理解度降低,反而得不償失。[name=Solomon]
3. 「異常偵測」會應用在什麼地方呢? 舉個例子, 我們有一門課, 期末考時上機考試. 你可以去 Moodle 下載你之前的作業, 但不可以透過 Moodle 互相討論。假設助教可以在一旁監看流量(但內容有加密, 所以無法看到確切內容), 你有沒有辦法設計一套系統, 來偵測同學們有舞弊的行為? 這時你就需要一套機制,判斷什麼樣的流量叫「正常」,什麼樣叫「不正常」。 [name= Prof Solomon]
4. 以國際慣例而言,建議讓遠端優先發言
- 原因:
- 容易被忘記
- 隨時可能斷線
5. 任何事情,二重點
- 準備充分。用具體例子帶入複雜公式(不要被公式嚇到:+1:)
- 有勇敢的心不要被嚇到
---
#### 問題
1. p.6 奬勵後的值, 累加起來有無上限 [name= Prof Solomon]
- Ans: 看起來沒有上限. 我寫了個程式模擬, 它跑到 100 [name= Solomon]
```python=
alpha1 = 0.9
v = 1.0
n = 1
print(n, v)
while v < 100:
n += 1
v = v + alpha1 ** v
print("{} - {:6.2f}".format(n, v))
```
2. 我覺得它可能像 log(x) 函式一樣, 雖然成長的速度緩慢, 但還是會到無限大.
## 臨時動議
1. 實驗室鑰匙有部分為上次換鎖前遺留的,目前僅剩二把備用,請問老師有需要再多打幾把嗎? [name= Edger]提出
- 舊的鑰匙既然不能用了, 就直接銷毀, 不需要留著製造麻煩。[name=Solomon]
- Crystal& Nicole將畢業,會多出二把鑰匙。故暫無須增加鑰匙。
2. 網路接線注意不要產生迴路, 不然會產生 [broadcast storm](https://en.wikipedia.org/wiki/Broadcast_radiation)
3. 一切公告資訊以[Facebook PEARL Group](https://www.facebook.com/groups/200175980420297)為主
## 下周會議
- 2020/08/04 19:00 科三 321
- 我建議日期寫成 2020/08/04, 這樣易於 sort [name=Solomon]
- 沒問題:ok: [name= Angela]
- 報告者 [name= Abner]
- 主題: (請Abner確定後公告)
---
散會:
結束時間:21:10