#### 3.25 進度 ## 論文篇章 :::info **1.Deep Reinforcement Learning-Based Task Scheduling in IoT Edge Computing** **2.Cost Efficient Scheduling for Delay-Sensitive Tasks in Edge Computing System** ::: ### 主要部份闡述 :::danger 本週工作主要是延續上週說的,並且我這周有嘗試著去延續上週沒有理解完的部份去作延伸搜索;上週主要是說邊緣運算系統的構成,並且闡述了部份原理,像是邊緣運算如何去分配任務,會遇到哪些多於的工作成本。這周主要逝去理解[1]的數學模型以及切割方式;然後先來說明一下細部組成:[1]有講述到在排程的部份分成waiting slot 和 backlog,所以之後的數學公式主要都是 構件在這兩區塊上,這篇論文的作法是將waiting slot化成一個waiting 矩陣,裡面紀錄的是 每一個task在Node的Queue裡面的等待時間,然後以這個矩陣為基礎,套用此論文設定的Policy 去作運算得出第一個最短的等待時間;再來backlog的作法也是類似上面的作法,最後根據兩種狀 況得出一個二維矩陣,去排序出最優節點。 然後此論文還有提到關於action space的使用,所謂的action space指的是在Node上的工作運行空間,本論文也把這個納入考量之內,所以將這一部份切成計算execution order 在 O tasks;其他則是計算M個VM處理同一個任務的速度,藉此去定義m*q+n,此公式為邊緣運算伺服器算出wait slot的數值,藉此去得到下面action 的公式: ![](https://i.imgur.com/qG2QnPm.png) 最後則是DRL算法,本論文有解釋此算法,藉由馬可夫決策過程去得出最後的算式,這裡我有想法是,除了用他的這種算法之外,我想要去得到一個新的決策過程,所以這裡可能之後會在找其他的論文來閱讀。 再來是[2]的部份,我當初是在想說我可不可以去理解工作成本的帶入模式,所以我去翻了論文,我的想法是類似於伺服端算一個成本,然後由節點端得出的成本去作交叉比對,這部份大概要再思考一下。下週的進度預計要得出所有的公式。 謝謝老師的閱讀 :::