HackMD - Collaborative Markdown Knowledge Base

#### 3.25 進度 ## 論文篇章 :::info **1.Deep Reinforcement Learning-Based Task Scheduling in IoT Edge Computing** **2.Cost Efficient Scheduling for Delay-Sensitive Tasks in Edge Computing System** ::: ### 主要部份闡述 :::danger 本週工作主要是延續上週說的，並且我這周有嘗試著去延續上週沒有理解完的部份去作延伸搜索；上週主要是說邊緣運算系統的構成，並且闡述了部份原理，像是邊緣運算如何去分配任務，會遇到哪些多於的工作成本。這周主要逝去理解[1]的數學模型以及切割方式；然後先來說明一下細部組成：[1]有講述到在排程的部份分成waiting slot 和 backlog，所以之後的數學公式主要都是構件在這兩區塊上，這篇論文的作法是將waiting slot化成一個waiting 矩陣，裡面紀錄的是每一個task在Node的Queue裡面的等待時間，然後以這個矩陣為基礎，套用此論文設定的Policy 去作運算得出第一個最短的等待時間；再來backlog的作法也是類似上面的作法，最後根據兩種狀況得出一個二維矩陣，去排序出最優節點。然後此論文還有提到關於action space的使用，所謂的action space指的是在Node上的工作運行空間，本論文也把這個納入考量之內，所以將這一部份切成計算execution order 在 O tasks；其他則是計算M個VM處理同一個任務的速度，藉此去定義m*q+n，此公式為邊緣運算伺服器算出wait slot的數值，藉此去得到下面action 的公式： ![](https://i.imgur.com/qG2QnPm.png) 最後則是DRL算法，本論文有解釋此算法，藉由馬可夫決策過程去得出最後的算式，這裡我有想法是，除了用他的這種算法之外，我想要去得到一個新的決策過程，所以這裡可能之後會在找其他的論文來閱讀。再來是[2]的部份，我當初是在想說我可不可以去理解工作成本的帶入模式，所以我去翻了論文，我的想法是類似於伺服端算一個成本，然後由節點端得出的成本去作交叉比對，這部份大概要再思考一下。下週的進度預計要得出所有的公式。謝謝老師的閱讀 :::