Lab Meeting Minutes 2024/05/22

--- title: Lab Meeting Minutes 2024/05/22 tags: lab_meeting --- > Outline > [TOC] --- # PERAL Lab Meeting - 時間：113 年 5 月 22 日 17:00 - 地點：線上 - 線上會議連結 : [Online](https://meet.google.com/zfi-zmnc-qfw) - 出席者：吳坤熹老師、謝萬霖、劉怡君、田蕙瑜、沈家正、梁宇騰、劉冠伶、繆亭霄、蘇翊荃、陳嘉璐、陳品妤、陳姿綾、陳姿澖 - 會議主題：[Oakestra](https://docs.google.com/presentation/d/1XTuTKLqdy-Ne93bs8ZXnVeA5pDdUpUHQ3bpXSlF9ZvY/edit?usp=sharing) - 主講者: 梁宇騰 - 主記: 陳品妤 ## 會議內容 ### Edge Computing ![image](https://hackmd.io/_uploads/HywQ74om0.png) - Problem: Central server has heavy overhead. - Service: Run service on many nodes which are put in different place. - less response time. ### K8s ![image](https://hackmd.io/_uploads/BkHuEEsQR.png) - Node for edge computing - Main service for central server. - Controller manager: make sure service(nodes) works and quality. - etcd: When server fault, etcd would make server restore. - Scheduler: assign un-done tasks to idle pods - Proxy in worker manage ip table of nodes. ### Oakestra ![Oakestra](https://hackmd.io/_uploads/HJeyYENiXC.png) ![Architecture](https://hackmd.io/_uploads/ryNSmEjXA.png) - Cluster ochestrator can have sub-cluster ochestrator ![Root Ochestrator](https://hackmd.io/_uploads/ByJUQNomR.png) - Similar to K8s' Master ![Cluster Ochestrator](https://hackmd.io/_uploads/B1FU7EsXC.png) - ![Worker Node](https://hackmd.io/_uploads/HyVD74omR.png) ![SLA (Service Level Agreements)](https://hackmd.io/_uploads/S18OX4iX0.png) - convergence_time: time between a job generated and assigned ![image](https://hackmd.io/_uploads/rkKq7VoXC.png) - SLA go through API to Service manager - Root Scheduler find the clusters that meet contraints - Node Engine and Net manager bulid subnet(?) ![Algorithm](https://hackmd.io/_uploads/r1IFmEjXR.png) - LDP: normal load balancer finds the least loading, but here we prioritize least latency - k8s choose the least overhead way. ![image](https://hackmd.io/_uploads/ByGpQ4jX0.png) - ![image](https://hackmd.io/_uploads/HJlhQNoXA.png) - If can't find IP in its cluster, will ask upper layer cluster ochestrator or root orchesrator instead ![image](https://hackmd.io/_uploads/Hkb1qVi70.png) - Reduce root cluster's overhead - --- ### 建議&問題 1. [name=Louise] p.13 有說其中一個參數是負責控制重新佈署的時間。想請問為什麼會需要重新佈署? p.14 Cluster A 本來就存在了嗎? 第三步驟說到 root 會通知 Cluster A manager。 Ans: [name=Miller] 因為可能找不到符合的 service，那他就會重新佈署，用另一種方式找。對，cluster A 本來就存在了。 1. [name=Yukino] P.17 Worker 的 IP address 有變動的時候別人要怎麼知道 Ans: [name=Miller] 會把這些資訊放在 service manager。待確認。 1. [name=Ellie] p.15 這個是 Load Balancing 的方式嗎? [name=Solomon] 這個演算法是在哪個步驟發生作用 Ans: [name=] Cluster Scheduler Q: 那 k8s 和 Oakestra 重視的因素不同(loading / latency)的原因？ Ans: [name=Solomon] k8s 和 Oakestra 解決的事情是不同的。Docker 讓人能快速架起服務，K8s 確保說這些服務在足夠多台機器上跑，要是有一台死掉趕快找另一台空閒的，但要是機器分散很遠就可能會挑到離比較遠的機器，就有很多人在想要怎麼微調演算法。這個 Oakestra 就提出這一套要考慮距離、local 優先的分配工作方式。 1. [name=Ellie] Node Engine 和 Net Mananger 是 private IP 還是 public IP? [name=Miller] 通常不會假設每台機器都有 public IP，溝通只會在同一個 cluster 中溝通。都用 public IP 有點浪費。 [name=Solomon] 應該不是浪費的問題，內部是透過 NAT，外部有 Net Manager。 [name=Ellie] 什麼情況會繼續往上一層機器找IP? [name=Miller] If P.14 的 Worker j and Worker m need to comunicate, this will happen. 1. [name=Selena] 到底要多少個 edge device、距離多遠，用 Oakestra 才會划算? edge device 彼此只要蒐集資料距離也很近，那需要用 Oakestra 嗎? 有做 Oakestra 相關的實驗嗎 ? Ans: [name=Miller] 目前還沒有做這樣的實驗，**未來的時候可以考慮一下**。架Voip server in different place with load balancing. 1. [name=Ryan] p.15 ROM 目標是找到最合適的資源，那和 knapsack 有什麼關聯嗎? [name=Solomon] How to use this charateristic of knapsack problem? [name=Solomon] Oakestra 的背包總和 resource limit 分別是什麼東西? Ans: [name=Miller] Use least CPU and memory is backpack. [name=Solomon] 目前感覺還沒有訂出研究的構想，要讓報告和自己研究有關係，不要為報告而報告。 [name=Solomon] Relay server occupy the resource. G.711 64k bps bandwidth [name=Solomon] knapsack、shortest path 等最佳化問題要先確定自己想要最佳化甚麼。 In Ryan's reserch, Resource limit is the number of user Ryan? 1. [name=Ashley] p.18 k8s 比 Oakestra 減少了很多資源? 有比較圖可以表示兩者的差別嗎?可以大概講講看實驗嗎? Ans: [name=Miller] In the paper, it compares okestra and similiar k8s to show that the memory utilization of the proposed system (Oakestra) is lower than K8s, MicroK8s, K3s. ![image](https://hackmd.io/_uploads/Ske3mBom0.png) 1. [name=August] p.13 好奇 `vcpus` & `vgpus` 分別代表甚麼? Ans: [name=Miller] virtual cpu & virtual gpu [name=August] P.17 甚麼時候會用哪一種 IP? Ans: [name=Miller]RR: round Robin [name=August] RR 代表 Round Robin ，什麼時候會用到? [name=Miller] 我的理解是他可能... [name=Solomon] 建議先實際裝一個Oakestra後再說明，免得 paper 寫得和他實驗的不一樣。 [name=August] 建議 : * P.1 name 大寫 * P.15 "resource" 紅字應要標完全 * 統一句子最前方第一個字應該要大寫 1. [name=Jiazheng] 簡報第二頁大標題 List -> Content [name=Solomon] Outline [name=Jiazheng] mDNS 一般會是甚麼名字。 Ans: [name=Miller] Service name map to IP. It can provide Service name and through DNS change to IP. 1. [name=Phoebe] 有建過 Oakestra or K8s? Ans: [name=Miller] 有建立 oakestra 但還沒有把服務部屬上去。K8s 有部屬過網頁。 1. [name=Egar] P.10 root scheduler 的 priority 怎麼計算的?How Root scheduler distribute vCPU? Ans: [name=Miller] 論文中沒有細部的聊到這部分 [name=Egar] Ans: [name=] 1. [name=Egar] p.13 我的經驗是只看硬體的規格，前四個我可以接受。後面不太確定，像 latency 應該要兩個機器才能計算，那他是怎麼計算的。 Ans: [name=Miller] Distance use Euclidean distance? Work node and upper layer;'s Worker node? [name=Solomon] I don't agree. Target node and [name=Egar] latency 是部署下去才知道，如果是 worker 本來有的話會不太準確 [name=Egar] 若每個 node 到同一個node 的latency被記錄，Latency 可以是一個特性 1. [name=Egar] 納悶地區(area)和地點(locatoin)的屬性? 一個比較大，一個更詳細。 [name=Solomon]那你的研究打算挑那些屬性 [name=Miller] Bandwidth、Latency、Area、CPU、Memory，但 Latency 存在疑慮 [name=Solomon]先把想要進行的服務先用 K8s 跑起來，發現有什麼缺點再用Oakestra改進。 ## 待追蹤事項 1. [name=] ## 臨時動議 1. [name=August] 因為老師臨時有事無法於 5/26 參加畢業路跑，路跑時間是否更改，6/2 or 5/26? Ans:5/26 2. 路跑資訊已公告 3. 有先定晚上的餐廳，因人數眾多，餐廳建議先點餐，稍後會再 PO 臉書。 4. 因OS期末考，下周 meeting 暫停一次 --- 散會結束時間： 18:28 ## note 謝謝大家幫忙! <3