---
title: Lab Meeting Minutes 2024/05/22
tags: lab_meeting
---
> Outline
> [TOC]
---
# PERAL Lab Meeting
- 時間:113 年 5 月 22 日 17:00
- 地點:線上
- 線上會議連結 : [Online](https://meet.google.com/zfi-zmnc-qfw)
- 出席者:吳坤熹老師、謝萬霖、劉怡君、田蕙瑜、沈家正、梁宇騰、劉冠伶、繆亭霄、蘇翊荃、陳嘉璐、陳品妤、陳姿綾、陳姿澖
- 會議主題:[Oakestra](https://docs.google.com/presentation/d/1XTuTKLqdy-Ne93bs8ZXnVeA5pDdUpUHQ3bpXSlF9ZvY/edit?usp=sharing)
- 主講者: 梁宇騰
- 主記: 陳品妤
## 會議內容
### Edge Computing
![image](https://hackmd.io/_uploads/HywQ74om0.png)
- Problem: Central server has heavy overhead.
- Service: Run service on many nodes which are put in different place.
- less response time.
### K8s
![image](https://hackmd.io/_uploads/BkHuEEsQR.png)
- Node for edge computing
- Main service for central server.
- Controller manager: make sure service(nodes) works and quality.
- etcd: When server fault, etcd would make server restore.
- Scheduler: assign un-done tasks to idle pods
- Proxy in worker manage ip table of nodes.
### Oakestra
![Oakestra](https://hackmd.io/_uploads/HJeyYENiXC.png)
![Architecture](https://hackmd.io/_uploads/ryNSmEjXA.png)
- Cluster ochestrator can have sub-cluster ochestrator
![Root Ochestrator](https://hackmd.io/_uploads/ByJUQNomR.png)
- Similar to K8s' Master
![Cluster Ochestrator](https://hackmd.io/_uploads/B1FU7EsXC.png)
-
![Worker Node](https://hackmd.io/_uploads/HyVD74omR.png)
![SLA (Service Level Agreements)](https://hackmd.io/_uploads/S18OX4iX0.png)
- convergence_time: time between a job generated and assigned
![image](https://hackmd.io/_uploads/rkKq7VoXC.png)
- SLA go through API to Service manager
- Root Scheduler find the clusters that meet contraints
- Node Engine and Net manager bulid subnet(?)
![Algorithm](https://hackmd.io/_uploads/r1IFmEjXR.png)
- LDP: normal load balancer finds the least loading, but here we prioritize least latency
- k8s choose the least overhead way.
![image](https://hackmd.io/_uploads/ByGpQ4jX0.png)
-
![image](https://hackmd.io/_uploads/HJlhQNoXA.png)
- If can't find IP in its cluster, will ask upper layer cluster ochestrator or root orchesrator instead
![image](https://hackmd.io/_uploads/Hkb1qVi70.png)
- Reduce root cluster's overhead
-
---
### 建議&問題
1. [name=Louise] p.13 有說其中一個參數是負責控制重新佈署的時間。想請問為什麼會需要重新佈署? p.14 Cluster A 本來就存在了嗎? 第三步驟說到 root 會通知 Cluster A manager。
Ans: [name=Miller] 因為可能找不到符合的 service,那他就會重新佈署,用另一種方式找。對,cluster A 本來就存在了。
1. [name=Yukino] P.17 Worker 的 IP address 有變動的時候別人要怎麼知道
Ans: [name=Miller] 會把這些資訊放在 service manager。待確認。
1. [name=Ellie] p.15 這個是 Load Balancing 的方式嗎?
[name=Solomon] 這個演算法是在哪個步驟發生作用
Ans: [name=] Cluster Scheduler
Q: 那 k8s 和 Oakestra 重視的因素不同(loading / latency)的原因?
Ans: [name=Solomon] k8s 和 Oakestra 解決的事情是不同的。Docker 讓人能快速架起服務,K8s 確保說這些服務在足夠多台機器上跑,要是有一台死掉趕快找另一台空閒的,但要是機器分散很遠就可能會挑到離比較遠的機器,就有很多人在想要怎麼微調演算法。這個 Oakestra 就提出這一套要考慮距離、local 優先的分配工作方式。
1. [name=Ellie] Node Engine 和 Net Mananger 是 private IP 還是 public IP?
[name=Miller] 通常不會假設每台機器都有 public IP,溝通只會在同一個 cluster 中溝通。都用 public IP 有點浪費。
[name=Solomon] 應該不是浪費的問題,內部是透過 NAT,外部有 Net Manager。
[name=Ellie] 什麼情況會繼續往上一層機器找IP?
[name=Miller] If P.14 的 Worker j and Worker m need to comunicate, this will happen.
1. [name=Selena] 到底要多少個 edge device、距離多遠,用 Oakestra 才會划算? edge device 彼此只要蒐集資料距離也很近,那需要用 Oakestra 嗎? 有做 Oakestra 相關的實驗嗎 ?
Ans: [name=Miller] 目前還沒有做這樣的實驗,**未來的時候可以考慮一下**。 架Voip server in different place with load balancing.
1. [name=Ryan] p.15 ROM 目標是找到最合適的資源,那和 knapsack 有什麼關聯嗎?
[name=Solomon] How to use this charateristic of knapsack problem?
[name=Solomon] Oakestra 的背包總和 resource limit 分別是什麼東西?
Ans: [name=Miller] Use least CPU and memory is backpack.
[name=Solomon] 目前感覺還沒有訂出研究的構想,要讓報告和自己研究有關係,不要為報告而報告。
[name=Solomon] Relay server occupy the resource. G.711 64k bps bandwidth
[name=Solomon] knapsack、shortest path 等最佳化問題要先確定自己想要最佳化甚麼。
In Ryan's reserch, Resource limit is the number of user
Ryan?
1. [name=Ashley] p.18 k8s 比 Oakestra 減少了很多資源? 有比較圖可以表示兩者的差別嗎?可以大概講講看實驗嗎?
Ans: [name=Miller] In the paper, it compares okestra and similiar k8s to show that the memory utilization of the proposed system (Oakestra) is lower than K8s, MicroK8s, K3s.
![image](https://hackmd.io/_uploads/Ske3mBom0.png)
1. [name=August] p.13 好奇 `vcpus` & `vgpus` 分別代表甚麼?
Ans: [name=Miller] virtual cpu & virtual gpu
[name=August] P.17 甚麼時候會用哪一種 IP?
Ans: [name=Miller]RR: round Robin
[name=August] RR 代表 Round Robin , 什麼時候會用到?
[name=Miller] 我的理解是他可能...
[name=Solomon] 建議先實際裝一個Oakestra後再說明,免得 paper 寫得和他實驗的不一樣。
[name=August] 建議 :
* P.1 name 大寫
* P.15 "resource" 紅字應要標完全
* 統一句子最前方第一個字應該要大寫
1. [name=Jiazheng] 簡報第二頁大標題 List -> Content
[name=Solomon] Outline
[name=Jiazheng] mDNS 一般會是甚麼名字。
Ans: [name=Miller] Service name map to IP. It can provide Service name and through DNS change to IP.
1. [name=Phoebe] 有建過 Oakestra or K8s?
Ans: [name=Miller] 有建立 oakestra 但還沒有把服務部屬上去。K8s 有部屬過網頁。
1. [name=Egar] P.10 root scheduler 的 priority 怎麼計算的?How Root scheduler distribute vCPU?
Ans: [name=Miller] 論文中沒有細部的聊到這部分
[name=Egar]
Ans: [name=]
1. [name=Egar] p.13 我的經驗是只看硬體的規格,前四個我可以接受。後面不太確定,像 latency 應該要兩個機器才能計算,那他是怎麼計算的。
Ans: [name=Miller] Distance use Euclidean distance? Work node and upper layer;'s Worker node?
[name=Solomon] I don't agree. Target node and
[name=Egar] latency 是部署下去才知道,如果是 worker 本來有的話會不太準確
[name=Egar] 若每個 node 到同一個node 的latency被記錄,Latency 可以是一個特性
1. [name=Egar] 納悶地區(area)和地點(locatoin)的屬性?
一個比較大,一個更詳細。
[name=Solomon]那你的研究打算挑那些屬性
[name=Miller] Bandwidth、Latency、Area、CPU、Memory,但 Latency 存在疑慮
[name=Solomon]先把想要進行的服務先用 K8s 跑起來,發現有什麼缺點再用Oakestra改進。
## 待追蹤事項
1. [name=]
## 臨時動議
1. [name=August] 因為老師臨時有事無法於 5/26 參加畢業路跑,路跑時間是否更改,6/2 or 5/26? Ans:5/26
2. 路跑資訊已公告
3. 有先定晚上的餐廳,因人數眾多,餐廳建議先點餐,稍後會再 PO 臉書。
4. 因OS期末考,下周 meeting 暫停一次
---
散會結束時間: 18:28
## note
謝謝大家幫忙! <3