<style> .reveal .slides { text-align: left; font-size:35px } </style> # Dynamic Programming ## 動態規劃 ---- ## 搞懂這些 一秒變成通靈大師 - 核心概念及前言 - 認識DP - DP的時間複雜度&&轉移式 - DP實作範例 - DP優化 --- ## 前言及核心概念 ---- ## 前言 -- DP 是啥? - 動態規劃。透過解決小問題組合成大問題的答案。 - DP 題通常難以被其他算法取代,且題型多種多樣。 - 為什麼會說 DP 是通靈則是因為一定程度的題目通常轉移式都不好求,很吃你的直覺。 - 遇到DP題的頻率大概為 1-2 題/場,但 **台灣站 3 題/場**,因此若是你 DP 很強可以拿去說嘴很久。 ---- ## 核心概念 -- DP的必知知識 - 分解 : 將大問題分解成小問題,計算出小問題的答案後再合併出大問題的解 - DP(動態規劃) : 分治法的延伸。當分割出來的子問題,一而再、再而三出現,儲存這些問題的答案,避免重複求解,以**空間換取時間**。 - 遇到問題-尋找問題分割方法-把大問題遞迴分割成更小的問題-設計計算過程-實作 ---- ### **[尋找問題分割方法]** 通常在 DP 裡面,總是可以找到當前狀態的前幾個狀態合併成為當前狀態,而特性如下。 1. 子問題與原問題的求解方式類似。 2. 子問題會一而再、再而三的出現。 3. 子問題以及原問題之間存在一定關係。 ---- ### **[把大問題遞迴分割成更小的問題]** 根據以上幾點,尋找到問題之間的關係後,即可分割成小問題去進行求解,求解過程主要是對小問題進行解答後,在根據小問題的答案進行下一步操作。 ---- ### **[設計計算過程]** 1. 確認每個問題需要哪些子問題來計算答案。 2. 確認總共有哪些問題。 3. 把問題一一對應到表格。 4. 決定問題的計算順序。 5. 確認初始值、計算範圍。 ---- ## 實作 分別有兩種方式 1. top-down : 程式碼中採用遞迴結構計算,從大問題往小問題遞迴(因此小問題先被解決)。這個實作方式的好處為只計算必要的問題,以及不必煩惱計算優先順序。 2. bottom-up : 先理出計算順序,然後由最小的問題開始計算。特色是程式碼通常只有幾個迴圈。這個實作方式的好處為常數較低,且可以自由控制計算順序,也不必擔心 stack overflow(遞迴過多層) --- ## 通靈的路上-認識DP 先看過兩題例題,為經典的記憶化搜索 ---- 例題Q1. 階乘求解 給你 $q$ 次詢問 每次給定數字 $n$ 詢問 $n!$ 為多少 根據前面的步驟,會發現 $n!$ 跟 $n-1$ 的關係為 $(n-1)! * n$ 所以就可以分割問題為 $1!,2!,3!,...,(n-1)!,n!$ 設計方法則為 每一層是前一層 $\times$ 當前層數 [ $(n-1)! * n$ ] 實作方法則在下面做出簡單的範例 ```cpp= void factorial(){ f[0] = 0; f[1] = 1; for (int i=2; i<=N; i++) f[i] = f[i-1] * i; } ``` ---- 分析例題一的時間複雜度以及空間複雜度 時間複雜度 : 總共 N 個問題,每個問題花費 O(1) 時間,總共花費 O(N) 時間。 空間複雜度 : 求 1! 到 N!, 總共 $N$ 個問題,用大小為 $N$ 的陣列儲存全部問題的答案,空間複雜度 $O(N)$ ---- ## 例題Q2 [遞迴數學式求解](https://zerojudge.tw/ShowProblem?problemid=d212) ![](https://i.imgur.com/RYSXONa.png) $q$ ($1$ $\le q \le 2\times 10^5$) 筆詢問 每筆詢問給予一個數字 $n$ ($1$ $\le n \le 10^6$) , 求 $f [ n ]$ 值為多少 ---- 思路 首先我們分析暴力做他的時間複雜度。 發現到這樣直接暴力解 $f(n-2)+f(n-1)$ 做會 TLE。 只需要開一個大小為 $10^6$ 的陣列 $dp$ 然後 $dp[i]$ 儲存 $f(i)$ 的結果就好,具體代碼如下。 ---- ### top-down ```cpp int f(int n){ if (n == 0 || n == 1) return 1; // 用 0 代表該問題還未計算答案 if (table[n]) return table[n]; return table[n] = f(n-1) + f(n-2); } int main(){ f(N); int q; while(cin >> q){ cout << f(q) << '\n'; } } ``` ---- ### Bottom-up ```cpp int main(){ table[0] = 1; table[1] = 1; for (int i=2; i<=N; i++) table[i] = table[i-1] + table[i-2]; int q; while(cin >> q){ cout << table[q] << '\n'; } } ``` ---- 分析例題二的時間複雜度以及空間複雜度 時間複雜度 : 總共 $N$ 個問題,每個問題花費 O(1) 時間,總共花費 O(N) 時間。 空間複雜度 : 求 $1$ 到 $N$,總共 $N$ 個問題,用大小為 $N$ 的陣列儲存全部問題的答案,空間複雜度 O(N) ---- ## Top-Down v.s. Bottom-Up - 理論上兩者時間複雜度相同,但前者用遞迴實作通常常數較大 - 對於 top-down,若一開始直接呼叫很大的狀態可能會 stack overflow - bottom-up 需要找出好的計算順序,對於有些DP不易找到 - top-down 只會計算該次呼叫所需要用到的所有子狀態,而 bottom-up 一次記算完所有子狀態 - 對於狀態很疏鬆的 DP,bottom-up 可能會計算很多冗餘的狀態 ---- - 如果狀態緊密且容易找出計算順序就用 bottom-up(常數小,沒有RE風險) - 反之才用 top-down - 大多 DP 都是由小計算到大因此容易找順序,除了少數DP有很奇怪的轉移式 - 大多 DP 狀態都是滿的,通常是暴搜的記憶化搜索才會是疏鬆的狀態 --- ## DP的時間/空間 複雜度&&轉移式 ---- ## DP的時間/空間 複雜度 簡單的時間複雜度 : 狀態數\*轉移複雜度 難的時間複雜度 : 根據每個人會有不同的實作方式去計算 狀態數 : 計算最終答案總共需要用到的子問題數量 轉移複雜度 : 計算任一個子問題的複雜度 空間複雜度 : 很直觀根據你開了多少來確定,應該不用太多描述。 ---- ## DP的轉移式 - 轉移式是用來表達 DP 的數學式子,類似遞迴數列的式子 - 不管你用何種實作方式都可以寫出一種 DP 的轉移式,有些簡單明瞭有些複雜到爆 - 主要是描述如何用小問題的解計算出大問題的解,也就是大問題跟小問題之間的關係 - 與 greedy 不同的是 greedy 是一直使用同種策略,dp 在複雜時會使用小問題擇優,或是多個小問題的集合求解。 ---- ### 範例 - $f(n)=f(n-1)+f(n-2)$ -- [遞迴數學式問題](https://zerojudge.tw/ShowProblem?problemid=d212) - $dp[i]=\max\limits_{0\le j\lt i,i-j<=k}\{dp[j]+a[i]\}$ -- [單調隊列優化](https://zerojudge.tw/ShowProblem?problemid=c528) - $dp[i][j]=\max({dp[i-1][j],dp[i-1][j-w[i]]+c[i]})$ [二維背包問題](https://zerojudge.tw/ShowProblem?problemid=a587) - $dp[i]=max(dp[i],dp[j]+1),\forall arr[i] > arr[j]\land i > j$ [LIS (最長遞增子序列)](https://zerojudge.tw/ShowProblem?problemid=d052) - $dp[i][j]=\begin{cases}dp[i-1][j-1]+1,s[i]=t[j]\\max(dp[i-1][j],dp[i][j-1]),s[i]\ne t[j]\end{cases}$ [LCS (最長公共子序列)](https://zerojudge.tw/ShowProblem?problemid=c001) ---- ### DP 的生命就是轉移式 - 清楚且完整的表達 DP 的關係 - 每一個 DP 狀態都有他所代表的東西 - 從轉移式中可以看出遞迴計算大問題所需要的子狀態與計算方式 - 大多 DP 可以從轉移式看出總狀態數與轉移複雜度 - 列出轉移式後,照著打就可以輕鬆的寫出 DP 的程式了(尤其是 top-down) - 容易推導 DP 優化 --- # 下課時間 --- ## DP經典問題實戰 * 零錢問題 * 背包問題 * 最長遞增子序列(LIS) * 最長共同子序列(LCS) ---- ## 零錢問題 題序 : 身上帶太多的零錢會很麻煩,因此會希望店員在找零錢能夠以最少的硬幣數來找,而不是全部都用1元塞給我們。 :cactus: 也就是要用最少的硬幣數湊出目標數字,具體作法為比較「每個硬幣的面額」與「其次小硬幣的面額」 :moneybag: 假設需要找$86 【[情況1](https://zerojudge.tw/ShowProblem?problemid=d904)】硬幣有:$50, $10, $5, $1 四種面額,由於每個數字都是次小數字的倍數,因此可以直接用greedy寫掉,從最大的硬幣去選。答案為 50\*1 + 10\*3 + 5\*1 + 1\*1 總共六枚 【[情況2](https://zerojudge.tw/ShowProblem?problemid=d133)】硬幣有:$50, $46, $10, $5, $1 五種面額,這時會發現greedy好像怪怪的,因此這時候就需要使用 [ 動態規劃 ] 去完成這題。 ---- ## top-down 使用遞迴法,分割子問題 目標(原問題): 要算出 86 元的最少硬幣數量 有 $50, $46, $10, $5, $1 這些種類的硬幣 分割為子問題: - 先找一個 $50,繼續求剩下的 $36 的最少硬幣數量 - 先找一個 $46,繼續求剩下的 $40 的最少硬幣數量 - 先找一個 $10,繼續求剩下的 $76 的最少硬幣數量 - 先找一個 $5,繼續求剩下的 $81 的最少硬幣數量 - 先找一個 $1,繼續求剩下的 $85 的最少硬幣數量 透過把大問題分解成更小的問題求解 ---- ```cpp vector<int> coins = {50, 46, 10, 5, 1}; int minimumChange(int x){ if(x == 0) return 0; int mn = 1e9; // 答案初始設成無限大(不可能達成) for(int i : coins){ if(x >= i){ // 判斷當前要找的錢 x 是否 >= 零錢 i // 使用一個大小為 i 的零錢找零,剩下的 $(x - i) 繼續求解 mn = min(mn, 1 + minimumChange(x - i)); } } return mn; } ``` ---- 過程中會發現同一個值 x 可能會出現很多次 以 76 為例: - $86 - 10 = 76$ - $86 - 5 - 5 = 76$ - $86 - 1 - 1 - 1 - 1 - 1 - 5 = 76$ - $86 - 1 - 1 ... - 1 = 76$ 如果每次 minimumChange(76) 都重新求解,則會花費很多時間 ---- ## 回到 DP 的核心概念 當分割出來的子問題,一而再、再而三出現,儲存這些問題的答案,避免重複求解,以空間換取時間。 - DP 狀態: $dp[ x ]$ - 紀錄目前要湊成金額 $x$ 的最少硬幣數目。 - 狀態轉移:當用一個硬幣面額 coins[i] 可以使用更少的硬幣數目來湊成金額 x 時,更新 `dp[` $x$ `] = min( dp[` $x$ `], dp[` $x$ `– coins[` $i$ `]] + 1)` ---- ```cpp vector<int> coins = {50, 46, 10, 5, 1}; int dp[100]; // 開大小至少為 n 的表格,紀錄所有會出現的狀態 int minimumChange(int x){ if(x == 0) return 0; if(dp[x]) return dp[x]; // 如果已經計算過了,則直接回傳這個問題的答案 int mn = 1e9; // 答案初始設成無限大(不可能達成) for(int i : coins){ if(x >= i){ // 判斷當前要找的錢 x 是否 >= 零錢 i // 使用一個大小為 i 的零錢找零,剩下的 $(x - i) 繼續求解 mn = min(mn, 1 + minimumChange(x - i)); } } return dp[x] = mn; // 每次算完一個問題的答案,把答案儲存起來 } ``` ---- ### 時間複雜度 找錢的範圍為 $n$,零錢種類數量 $m$, $n$ 個問題,每個問題有 $m$ 個轉移 因此時間複雜度為 $O(nm)$ ### 空間複雜度 開了大小為 $n$ $(要找的錢大小)$ 的陣列,複雜度 $O(n)$ ---- ## bottom-up - $dp[ i ]$:紀錄目前要湊成金額 $x$ 的最少硬幣數目。 - 初始化 : $dp[i] = \begin{cases}0, & i = 0\\ \infty, & i > 0\end{cases}$ - 狀態轉移:當已經知道 $dp[i]$ 最少需要多少硬幣時,使用 `coins[j]` 更新 `dp[i + coins[j]] =` `min( dp[i + coins[j]], dp[ i ] + 1 )`; - 時間複雜度 : 找錢的範圍 $n$,零錢種類數量 $m$,總共有 $nm$ 個問題,因此時間複雜度為 $O(nm)$ ---- ## [背包問題](https://zerojudge.tw/ShowProblem?problemid=b131) n 個物品儘量塞進背包裡面,令背包裡面的物品總價值最高。背包有重量限制 $w$。 :handbag: 這就是廣為人知的背包問題,其有許多變形,而本堂課將介紹最經典的 [ 0/1 背包問題 ] 「 0/1 」的意思是:每個物品只會放進背包零個或一個。一個物品要嘛整個不放進背包、要嘛整個放進背包。物品無法切割。 看到這種問題若沒學過直覺通常會是貪心,不管是貪心他的價值或是貪心他的 CP 值也好,在這種題目下面都是錯的。 0/1 背包問題的關鍵點,在於如何有效利用背包的剩餘重量,找出最好的物品組合方式。 ---- 第一步,分割問題。 然而分割問題的方式很簡單:對某一件物品來說,我們可以選擇放或不放;然後移去這件物品,縮小問題範疇。 一件物品不放進背包,背包價值不變、背包耐重不變;一件物品放進背包,背包價值上升、背包耐重下降。遞迴公式為: $c$ ($n$, $w$) $=$ $max$$( c(n-1, w)$, $c(n-1, w-weight[n])$ $+$ $cost[n]$ ) 就可以依照這個遞迴公式去設計 top-down 的版本 過程中,dp[n][w] 這個狀態是可以記錄的,會不斷重複出現 ---- 而 bottom-up 的迴圈版本如下: ```cpp for (int i = 0; i < n; ++i) for (int j = weight[i]; j <= w; j++) // 由後往前 dp[i][j] = max(dp[i][j], dp[i-1][j - weight[i]] + cost[i]); ``` ---- * $dp[ i ][ j ]$:紀錄使用前 $i$ 個元素,背包重量使用了 $j$ 的最大價值。 * 測試每個物品 $weight[ i ]$ 放或不放 * 狀態轉移方程:當有一個更好的方法是在同重量下可以獲得更高價值時,更新 $dp[i][j] = max(dp[i][j], dp[i-1][j - weight[i]] + value[i]);$ * 初始化 : $dp[ i ][ j ] = 0$ $\forall i = 0\sim n, j = 0\sim w$ * 時間複雜度 : 背包的範圍$N$,物品種類數量$M$,總共有 $NM$ 個問題,因此時間複雜度為 $O(NM)$ ---- ## 最長遞增子序列(LIS) 題序 : 從一連串的整數序列中選出最長的嚴格遞增子序列(strictly longest increasing subsequence)。 例如:在 $\{1, 3, 2, 2, 4, 0\}$ 中 LIS 為 $1, 3, 4$ 或者 $1, 2, 4$。 ---- 第一步 分割問題 : 記錄**第 i 個元素為 LIS 的結尾**下的 LIS 長度 第二步 設計算法 : 每次檢查位置 $i$ 是否存在任何位置 $j$ $(j < i)$,則 arr[i] 可以接在 arr[j] 後面,dp[i] = dp[j] +1, ---- 範例代碼 ```cpp int LIS(){ // 初始化。每一個元素本身就是長度為 1 的 LIS。 for (int i=0; i<N; i++) dp[i] = 1; for (int i=0; i<N; i++) // 找出 arr[i] 能接在哪些數字後面 // 若是可以接,長度就增加。 for (int j=0; j<i; j++) if (arr[j] < arr[i]) dp[i] = max(dp[i], dp[j] + 1); // dp[] 之中最大的值即為 LIS 的長度。 return *max_element(dp, dp+n); } ``` ---- * $dp[ i ]$ : 以 $arr[i]$ 為結尾的最長遞增子序列長度 * 測試每個字串結尾 $arr[ i ]$ * 狀態轉移方程:當有一個更好的方法是在同長度下可以獲得更長序列時,更新 : $dp[i]=max(dp[i],dp[j]+1)$ * 初始化:$dp[i]=1$ $(1 \le i \le n)$ 至少選自己長度為 1 * 時間複雜度 : 狀態數 $O(N)$,轉移複雜度 $O(N)$,總複雜度 $O(N^2)$ ---- ## 最長共同子序列 (LCS) 題序 : 給定兩個字串 $s, t$,求 $s$ 與 $t$ 的最長共同子序列( Longest Common Subsequence ) 第一步 分割問題,記錄在分別字串前綴 s[0..i] 和 t[0..j] 下的 LCS 長度 第二步 設計算法,每次檢查當前的結尾 s[i] 是否與 t[j] 一樣,若是一樣 則 $dp[ i ][ j ] = dp[ i-1 ][ j-1 ] + 1$ 否則 $dp[ i ][ j ]$ 就會等於 $max(dp[i-1][j], dp[ i ][ j-1 ]$) ---- ### sample x = "ABCBDAB" y = "BDCABA" ![](https://i.imgur.com/lkrXVkj.png) ---- * $dp[i][j]$代表字串前綴$s_{0...i}$與$t_{0...j}$的LCS * 轉移式 : $dp[i][j]=\begin{cases}dp[i-1][j-1]+1,s[i]=t[j]\\max(dp[i-1][j],dp[i][j-1]),s[i]\ne t[j]\end{cases}$ * 初始化 : $dp[i][j]=0$ * 時間複雜度 : 狀態數$O(n^2)$,轉移複雜度$O(1)$,總複雜度$O(n^2)$ * 通常為了方便會把 $dp$ 陣列平移,且此 DP 可以滾動 ---- ## 路徑回朔 要尋找哪一個才是合法的 LCS 時,我們就需要紀錄每一個字串的選取,由於每次查找的是 $dp[x-1][y]$ 跟 $dp[x][y-1]$ 哪個長度更長。 最後從 $len1$ , $len2$ 開始往前回溯,輸出最長公共子序列。 ---- 範例代碼 ```cpp string ans; void trace(int x,int y){ if(!x&&!y) return ; if(tag[x][y]==0){ trace(x-1,y-1); ans += s[x-1]; } else if(tag[x][y]==1) trace(x-1,y); else trace(x,y-1); } void solve(){ cin >> s >> t; len1 = s.size(), len2 = t.size(); for(int i = 1; i <= l1; i++) tag[i][0]=1; for(int i = 1; i <= l2; i++) tag[0][i]=-1; for (int i = 1; i <= l1; i++) { for (int j = 1; j <= l2; j++) { if (s[i-1] == t[j-1]) { dp[i][j] = dp[i-1][j-1] + 1; tag[i][j] = 0; } else if(dp[i-1][j]>=dp[i][j-1]){ dp[i][j] = dp[i-1][j]; tag[i][j] = 1; } else{ dp[i][j]=dp[i][j-1]; tag[i][j] = -1; } } } cout << dp[len1][len2] << "\n"; trace(len1,len2); reverse(ans.begin(), ans.end()); cout << ans << endl; } ``` --- ## DP 優化 ---- ## 時間上的優化 - 有非常多的種類,分別用在不同的情況 - 單調隊列優化、斜率優化、四邊形優化、分治優化、矩陣快速冪、多項式乘法、aliens 優化... - 由於是進階內容,本堂課程內容著重於讓大家認識 DP 以及可以靠自己列出轉移式,因此本堂沒有要教,若已熟知基礎 DP 內容或是對以上優化有興趣都可以再來敲我們問 ---- ## 空間上的優化 ### 滾動 DP 很直覺的優化方式之一 滾動數組的作用在於優化空間。因為 DP 題目是一個自底向上的擴展過程,我們常常需要用到的是線性的解,前面的解往往不用紀錄。所以用滾動數組優化是很有效的。利用滾動數組的話在N很大的情況下可以達到壓縮存儲的作用,通常可以直接壓掉一個維度的大小。 ex: dp[N][M] $\to$ dp[N] ---- - 再次拿遞迴數學式來舉例 - $f(n)=f(n-1)+f(n-2)$ - 可以看出計算每一項在計算時,只會用到$dp[n],dp[n-1],dp[n-2]$ - 因此原本需要開到$N$大的空間數組就不需要開,只需要開3個變數 - 只能用bottom-up計算,只需要三個變數交替使用$cur,pre,ppre$ ```cpp int cur,pre=1,ppre=0; for(int i=2;i<=n;i++) cur=pre+ppre,ppre=pre,pre=cur; ``` ---- ### 滾動 DP 結論 - 用來節省空間,常常可以節省一個維度 - 不是所有 DP 都可以滾動 - 用於 bottom-up,單次計算 - 從轉移式中看計算每一項所需要用到的子狀態是否有跟著遞增(算到後面,前面的狀態就不會再被使用) ---- ## 直接實作最後一題 : 二階樓梯記數問題 一個 $n\times n$ 方格棋盤,從左上角走到右下角,每次只能往右走一格或者往下走一格。請問有幾種走法? example : ![](https://i.imgur.com/v5zmP8o.png) 第一步 分割問題 會發現對於任何一個方格來說,只可能「從上走來」或者「從左走來」,答案是兩者相加,也就是說可以從上方以及左方的方格步數推算出當前這格的步數。 ---- 設計轉移式 $dp[i][j]$ 代表走到當前 $i$, $j$ 格有幾種方法,因此$dp[i][j] = dp[i-1][j] + dp[i][j-1]$ 然後這時候就會發現,他的轉移式只需要用到 $i$ 的前一項或者是 $j$ 的前一項,那是否可以節省空間呢 答案是必然的,如果不需要儲存所有問題的答案,只想要得到其中一個特定問題的答案,那只需要一維陣列就夠了,也就是 O(N) 空間。 ```cpp for (int i=1; i<N; i++) for (int j=1; j<N; j++) f[j] += f[j-1]; ``` 就成功的作出了空間優化了 --- # 總結 DP 是個博大精深的演算法,初學者剛學演算法很快就會碰到,然而難的 DP 也可以到變成防破台 :fearful: 也是因為 DP 不論從難度、類型來看,變化都非常多,所以幾乎所有競賽 DP 都扮演很重要的角色(台灣站更是每年 DP 占了都 1/3 的題數),也因此好好學會 DP 非常的重要! ---- DP 不算是一個制式的演算法,而是一種概念,因此它的用途/形式多變想學好它不是很容易,要能在在看到題目時有辦法快速辨別能不能 DP / 怎麼 DP 等只能靠多看題目多練習(把各種類型的 DP 都看很多次自然而然就會熟悉模式了(O)) :poop:
{"title":"動態規劃(Dynamic Programming)","description":"Introduction to Competitive Programming2/8","contributors":"[{\"id\":\"19f09ccf-6b99-452f-971f-955cfc1657f3\",\"add\":13825,\"del\":2035}]"}
    582 views
   owned this note