2020 Week 3: Thought method

--- tags: 成大高階競技程式設計 2020, ys --- :+1: [2020 競技程設教材 HackMD Book](https://hackmd.io/@nckuacm/ryLIV6BYI) :+1: 2020 Week 3: Thought method = # 設計演算法的思維本章先以**最大連續和問題**探討常見的設計演算法切入點： - 枚舉 - 分治 - 動態規劃 - 貪心接著會對各個常見思考方式提供一些範例題目 ## 最大連續和問題 #### 範例 [LeetCode 53 Maximum Subarray](https://leetcode.com/problems/maximum-subarray) :::info 給定一個長度為 $N$ 的整數數列 $A_1, A_2, ... , A_N$，要求找到 $1 \leq i \leq j \leq N$，使得 $A_i+A_{i+1}+...+A_j$ 儘量大。 ::: > 注意數列中可能會有負數 ### 枚舉所謂枚舉，通俗點說就是**數出**部份給定的集合中元素。下面直接給出程式來解決最大連續和問題： ```cpp int best = A[1]; //與其用無限小，不如這樣初始化更不易出錯 for (int L = 1; L <= N; i++) { for (int R = L; R <= N; R++) { int sum = 0; for (int k = L; k <= R; k++) sum += A[k]; best = max(best, sum); } } ``` 通常枚舉會做為解題的起手式，有了正確性再考量改進方法枚舉可將困難的**求值**問題化為簡單的**判定**問題 > 雖然計算量可能會變高，但針對問題特性能再改進仔細觀察上面的演算法，會發現遞增 $k$ 跟遞增 $R$ 其實是同一回事，可改進為： ```cpp for(int L = 0; L <= N; L++) { int sum = 0; for(int R = L; R <= N; R++) { sum += A[R]; best = max(best, sum); } } ``` #### 練習： [GCJ Kickstart Round G 2018 A Product Triplets](https://code.google.com/codejam/contest/5374486/dashboard#s=p0): Small dataset ### 分治法分治 (divide & conquer) 簡稱 D&C，就是將一個大的問題，**分成**幾個互相*獨立*的子問題，然後再將子問題分成子子問題[^2]，一直重複分割的動作，直到最小的問題足夠和別的最小問題**合併求解**出父問題。將數列切一半，問左半的以及右半的最大連續和多少，以及問包含切開的那道分水嶺的最大連續和為多少，選出三者中最大值，它就是整個數列(原問題)的最大連續和： ```cpp int maxsum(int l, int r) { // 此為左閉右開區間 [l, r) if (r-l == 1) return A[l]; int m = (r+l)/2, sum, centre = A[m]; sum = 0; for (int i = m; i < r; i++) centre = max(centre, sum += A[i]); sum = centre; for (int i = m-1; i >= l; i--) centre = max(centre, sum += A[i]); return max(centre, max(maxsum(l, m), maxsum(m, r))); } ``` 要驗證分治法的正確性，只需考慮子問題[^3]們解完後(假設已拿到解)，再合併為父問題看是否解完即可，並考慮最小的孫子問題到的邊界是否正確。 ### 動態規劃部份朋友可能知道可以令 $S_i = A_1 + A_2 + ... A_i$ 而 $A_i+A_{i+1}+...+A_j = S_j - S_{i-1}$ 這樣子有了 $S_i$ 就可將連續和的計算從 $O(N)$ 降為 $O(1)$ 構造 $S_i$ 非常的直覺： ```cpp S[0] = 0; for (int i = 1; i <= N; i++) S[i] = S[i-1] + A[i]; ``` 從**邊界**遞推地**記錄**所有問題的解，且一個項用到前一項的**最佳**結果，就是動態規劃的精神。通常應用動態規劃思考的問題會是**求極值**或是**確定值**的問題。 > $S_i$ 的值就是個確定值的例子而程式可改為： ```cpp for (int L = 1; L <= N; L++) for (int R = L; R <= N; R++) best = max(best, S[R] - S[L-1]); ``` 複雜度為 $O(N^2)$。 [CODEFORCES 327A Flipping Game](https://codeforces.com/contest/327/problem/A) ### 貪心法籠統的講，每次做一個在**當下看起來**最佳的決策，進而漸漸求出全局最佳解 > 這種短視近利的心態，居然也是個不錯的思維( > 貪心法是動態規劃的特例，貪心可用動態規劃的角度去看先猜想連續和一直累加就有機會變得更大，但會有兩種狀況發生： - 連續和為正值：下一項使它變小，但未來可能會讓它更大，所以繼續加 - 連續和為負值：重新計算連續和可能得到更大的連續和 ```cpp int best = A[N], sum = 0; for (int R = 1; R <= N; R++) { sum = max(A[R], sum + A[R]); best = max(best, sum); } ``` 因為不確定何時是目標區間，所以用 `best` 更新最大連續和為多少 #### 練習： [ZEROJUDGE d652 貪婪之糊](https://zerojudge.tw/ShowProblem?problemid=d652) # 枚舉範例 #### 範例最長回文子字串： :::info 給定一長度 $N$ 字串 $S$，算出**最長回文子字串**的長度 ::: 例如 $\text{aabab}$ 有 $\text{a, a, b, a, b, aa, aba, bab}$ 共 6 個**回文子字串** > 回文為正著看與反著看**一樣**的字而在其中，$\text{aba, bab}$ 是**最長**的，所以答案為 3 可以採用上面[連續和](#枚舉)的做法，先將每個區間數出來，再判斷其是否為回文 ```cpp int ans = 0; for(int L = 0; L < N; L++) for(int R = L; R < N; R++) if(is_palindrome(L, R)) ans = max(ans, R-L+1); ``` 但判斷字串為回文 (`is_palindrome(L, R)`) 需 $O(N)$，綜合起來這做法要 $O(N^3)$ > 由於要正著和反著一一比對仔細觀察回文字串的特性，回文的組成是兩字元**相同**成對的當有回文 $A$，其 $aAa, baAab, \cdots$ 也是回文當字串 $B$ 不是回文，$aBa, baBab, \cdots$，不管**兩端同時**擴充什麼字元都不是回文所以對每個字元往外擴充，或是從字元跟字元的隙縫擴充，看是否為回文 ```cpp int ans = 1; // 從單個字元擴充 for(int i = 0; i < N; i++) for(int l = 1; i-l >= 0 && i+l < N; l++) { if(S[i-l] != S[i+l]) break; ans = max(ans, l*2 + 1); } // 從字元跟字元間擴充 for(int i = 0; i < N; i++) for(int l = 1; i-l >= 0 && i+l-1 < N; l++) { if(S[i-l] != S[i+l-1]) break; ans = max(ans, l*2); } ``` > 也就是說找對**對象**很重要，若不研究題目**性質**而草率枚舉效率也就一般般。 #### 範例印出九九九九九九九九九九九九九九九乘法表 > 先數一下到底有幾個九，好，共 $15$ 個若是九九乘法表(九只有兩個)應該能很輕易的寫出來吧？ ```cpp for(int L = 1; L <= 9; L++) for(int R = 1; R <= 9; R++) printf("%d * %d = %d\n", L, R, L*R); ``` 但 $15$ 個的話，寫 $15$ 層迴圈未免也太累了這狀況就體現了[遞迴](#%E7%AF%84%E4%BE%8B-%E5%8D%B0%E5%87%BA%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%9D%E4%B9%98%E6%B3%95%E8%A1%A8)保存過去的狀態的方便之處： ```cpp int const depth = 15; void dfs(int i, long long res) { // res := result if(i > depth) { for(int j = 1; j <= depth; j++) printf("%d %c ", q[j], (j != depth)? '*' : '='); printf("%lld\n", res); return; } for(int j = 1; j <= depth; j++) { q[i] = j; dfs(i+1, res * j); } } ``` 呼叫函式為 `dfs(1, 1)` > 如果好奇 `dfs` 是甚麼的話，第五週會教 DFS (Depth-First Search)  # 分治法範例 #### 範例 [TIOJ 1080 A.逆序數對](https://tioj.ck.tp.edu.tw/problems/1080)： :::info 給長度為 $n$ 的數列 $a_0, a_1, \cdots , a_{n-1}$ 若 $i < j$ 且 $a_i > a_j$，則 $(a_i, a_j)$ 稱為逆序數對請計算出該數列中有多少逆序數對 ::: 先試試枚舉： ```cpp int cnt = 0; for(int i = 0; i < n; i++) for(int j = i+1; j < n; j++) if(a[i] > a[j]) cnt++; ``` 了無新意，來開始研究題目的性質吧一次要處理太多數字很不知所措，那麼就先**觀察小規模**的問題 $n=2$，有 $4, 3$，則有逆序數對 $(4, 3)$ $n=4$，有 $3, 4, 7, 1$，則有逆序數對 $(3, 1), (4, 1), (7, 1)$ 綜觀全局，會發現逆序就是大的數字在左邊，小的數字在右邊 > 這不是廢話嗎？但小規模的話可能會一對對數字去看，大規模則可以**切成兩區**去比對這給了一種解法的動機：分而治之每次切成兩個區塊，區塊內的數對假設已計算好了接著從分界的兩邊去看，左區若是有比右區還大的數字，就記一筆假設左區有 $N$ 個數字 $a_i$，右區有 $M$ 個數字 $b_j$，則： ```cpp int cnt = 0; for(int i = 0; i < N; i++) for(int j = 0; j < M; j++) if(a[i] > b[j]) cnt++; ``` 整個完整程式碼就變成如下： ```cpp int count(int l, int r) { // [l, r) 左閉右開區間 if(r-l == 1) return 0; int m = (l+r)/2, cnt = 0; cnt += count(l, m); cnt += count(m, r); for(int i = l; i < m; i++) for(int j = m; j < r; j++) if(a[i] > a[j]) cnt++; return cnt; } ``` 但估算一下，這複雜度不是沒改善嗎？再回去觀察一下問題，例如 $4, 5, 1, 2, 3, 9$ 從中間切開的話則為 $4, 5, 1$ 與 $2, 3, 9$ 假設從 $4$ 開始比對完 $(4, 2), (4, 3)$ 那麼從 $5$ 比對的話，由於 $5 > 4$，能得知至少也有兩個數 $2, 3$ 與 $5$ 組成逆序這個給了個契機讓左區的數們都按照**升序**排列也讓右區的數字**升序**的話，在遇到右區數 $a$ 比左區數 $b$ 大時，由於 $a$ 之後的數都會比 $b$ 大，也能讓左區換下個數。 ```cpp int count(int l, int r) { // [l, r) if(r-l == 1) return 0; int m = (l+r)/2, cnt = 0; cnt += count(l, m); cnt += count(m, r); vector<int> b; // 保存升序數列 int j = m; for(int i = l; i < m; i++) { while(j < r && a[i] > a[j]) b.push_back(a[j++]); b.push_back(a[i]); cnt += j-m; } while(j < r) b.push_back(a[j++]); copy(b.begin(), b.end(), a+l); return cnt; } ```  # 動態規劃範例 > 若這節沒法好好理解，先看個感覺就行，第七週將會有動態規劃的完整介紹 #### 範例 [LeetCode 70 Climbing Stairs](https://leetcode.com/problems/climbing-stairs/)： :::info 上樓梯每走一次可以走 $1$ 或 $2$ 階，從 $0$ 階(地板)開始走到 $n$ 階的走法有幾種？ ::: 若 $n = 0$，則答案直接為 $1$ 若 $n = 1$，則答案為 $1$ 若 $n = 2$，由於可以每次都走 $1$ 階，或直接走 $2$ 階，則答案為 $2$ 得知造成答案變動的**決策**就只有每次要走 $1$ 階還是走 $2$ 階的選擇設**狀態** $dp(i)$ 表示從 $0$ 走到第 $i$ 階的走法數則從 $i-1$ 走 $1$ 階會到 $i$ 階，從 $i-2$ 走 $2$ 階會到 $i$ 階，除此之外沒有別的走法得知**狀態轉移** $dp(i) = dp(i-1) + dp(i-2)$ 在程式中，$dp(i-1), dp(i-2)$ 會是已經解完的狀態(子問題) 而透過這兩個狀態，能將尚未求解的 $dp(i)$ 得解，進而再去求解其他大問題 ```cpp dp[0] = dp[1] = 1; for(int i = 2; i <= n; i++) dp[i] = dp[i-1] + dp[i-2]; ``` > 這其實就是在求費式數 #### 範例 [LeetCode 64 Minimum Path Sum](https://leetcode.com/problems/minimum-path-sum/)： :::info 給定 $M \times N$ 表格，每格有正整數 $a_{r, c} \mid 1 \le r \le M, 1 \le c \le N$ 從左上角走到右下角，每次只往右或下走的路徑**最小總和**為何？ ::: 例如 $M = N = 3$ 表格如下： |1|2|3| |-|-|-| |6|5|**4**| |7|8|**9**| 粗體路徑上面的數加總起來比其他路徑加總的和還要小根據題目，每次能做的**決策**只有兩個：往右、往下往右，那麼位置 $(i, j-1)$ 就會變成 $(i, j)$ 往下，那麼位置 $(i-1, j)$ 就會變成 $(i, j)$ 定義 $dp(i, j)$ 為從起點到 $(i, j)$ 的最小和直接的，$dp(i, j) = \min(dp(i-1, j), dp(i, j-1)) + a_{i, j}$ ```cpp dp[1][0] = dp[0][1] = 0; // 起點以前的總和為 0 for(int t = 2; t <= max(M, N); t++) dp[0][t] = dp[t][0] = 0x3fffffff; // 初始化為無限大，因為路徑不從這幾格開始走 for(int i = 1; i <= M; i++) for(int j = 1; j <= N; j++) dp[i][j] = min(dp[i-1][j], dp[i][j-1]) + a[i][j]; ``` #### 範例 [CODEFORCES 1033C Permutation Game](https://codeforces.com/problemset/problem/1033/C)：注意到，當 token 為 $n$ 那麼**該局**移動者必輸，因為沒有比 $n$ 更大的數 > 可以從邊界觀察出解法切入點一局先手贏則後手輸，反之亦然；所以看先手狀態即可先手輸贏只看**移動**決策得知，即**狀態轉移**只看從左來或右來所以狀態為 $w(i)$ 表示從 $i$ 開局先手是輸是贏從 $a_i$ 開局，根據題目設 $j \equiv i \mod a_i$ 且 $a_j > a_i$ 且 $w(j)$ 為輸，則 $w(i)$ 為贏 >因為先手 Alice 只要從 $i$ 移動到 $j$，後手 Bob 就無法移動了 ```cpp for(int i = 1; i <= n; i++) { scanf("%d", &a[i]); idx[a[i]] = i; } memset(w, false, sizeof w); // w[n] 已解先手必輸 for(int ai = n-1; ai >= 1; ai--) { for(int j = idx[ai]%ai; j <= n; j+=ai) if(a[j] > ai && !w[j]) w[idx[ai]] = true; } ``` `idx` 是記錄每個數字分別對應的位置注意**計算順序**從 `n-1` 減至 `1`，因為對於欲解 $w(i)$ 時保證比 $a_i$ 大的所有數 $a_j$，$w(j)$ 都已解 #### 範例 [CODEFORCES 429B Working out](https://codeforces.com/contest/429/problem/B)：沿用[最小路徑和](#範例-LeetCode-64-Minimum-Path-Sum：)的作法，可將左上與左下到見面點，以及見面點到右上與右下的最大和都求出來 ```cpp for(int i = 1; i <= n; i++) for(int j = 1; j <= m; j++) LT_mt[i][j] = a[i][j] + max(LT_mt[i-1][j], LT_mt[i][j-1]); for(int i = n; i >= 1; i--) for(int j = m; j >= 1; j--) RB_mt[i][j] = a[i][j] + max(RB_mt[i+1][j], RB_mt[i][j+1]); for(int i = n; i >= 1; i--) for(int j = 1; j <= m; j++) LB_mt[i][j] = a[i][j] + max(LB_mt[i+1][j], LB_mt[i][j-1]); for(int i = 1; i <= n; i++) for(int j = m; j >= 1; j--) RT_mt[i][j] = a[i][j] + max(RT_mt[i-1][j], RT_mt[i][j+1]); ``` 注意題意，若是他們只能見面恰好一次，那麼對於見面的點 $(x, y)$，一方只能**上下經過**，另一方只得**左右經過** 若一方不這麼做，例如 Iahub 走 $(x-1, y) \to (x, y) \to (x, y+1)$ 則 Iahubina 從 $(x, y)$ 往上或右分別會碰到 $(x-1, y), (x, y+1)$，就不是恰好碰面一次於是，將所有可能的見面點都考慮可得： ```cpp int best = 0; for(int i = 2; i < n; i++) for(int j = 2; j < m; j++) best = max({best, LT_mt[i-1][j]+RB_mt[i+1][j] + LB_mt[i][j-1]+RT_mt[i][j+1], LT_mt[i][j-1]+RB_mt[i][j+1] + LB_mt[i+1][j]+RT_mt[i-1][j]}); ``` #### 範例 Guitar Fingering： :::info 給你一把吉他，和 $N$ 個要彈的音符 $a_i$，以及指法難度 $d$ $d(a, x, b, y)$ 表示 $a$ 音符用第 $x$ 根手指彈奏，緊接著再用 $y$ 手指彈奏 $b$ 音符的難度，其中 $1 \le x, y \le L$ 要求彈完所有音符所需的**最低**總指法難度 ::: > 一般人類 $L = 5$，因為只有 $5$ 根手指，但假設非人類存在(e.g. 外星人、機器人) 明顯的，定義狀態 $dp(i)$ 表示從第 $i$ 個音符開始彈奏的最小難度對於考慮使用 $x$ 彈奏 $a_i$，狀態轉移為 $dp(i) = \min\{dp(i+1)+d(a_i, x, a_{i+1}, y) \mid 1 \le x \le L\}$ 但等一下，$y$ 是甚麼？這裡並沒有提出該用哪根手指彈下個音符！於是需要提供**更多資訊**，好讓狀態能滿足問題所求 $dp(i, x)$ 表示從第 $i$ 個音符開始彈奏的最小難度，並用 $x$ 彈奏 $a_i$ 那麼狀態轉移就為 $\forall x. dp(i, x) = \min\{dp(i+1, y)+d(a_i, x, a_{i+1}, y) \mid 1 \le y \le L\}$ ```cpp memset(dp, 0x3f, sizeof dp); // 初始為無限大 for(int x = 1; x <= L; x++) dp[N][x] = 0; // 邊界 for(int i = N-1; i >= 1; i--) for(int x = 1; x <= L; x++) for(int y = 1; y <= L; y++) dp[i][x] = min(dp[i][x], dp[i+1][y] + d(a[i], x, a[i+1], y)); int best = 0x3f3f3f3f; for(int x = 1; x <= L; x++) best = min(best, dp[1][x]); ``` #### 範例 Longest Increasing Subsequence (LIS)： > Longest Increasing Subsequence 中譯為最長**遞增**子序列 :::info 在給定 $N$ 長度序列 $a$，找到一個子序列，為**嚴格遞增**且長度**最長**。 ::: 例如 $a = (\textbf{1}, 4, \textbf{2}, 3, 8, \textbf{3}, \textbf{4}, 1, \textbf{9})$ 則 LIS 為 $(1, 2, 3, 4, 9)$ 或 $(1, 2, 3, 8, 9)$ 仔細考慮，若某數字在某遞增子序列**後**出現，且它比此序列的末項還**大**，那麼加入它就能形成更長的遞增子序列！不過在那之前，這個遞增序列是如何求得的？通過上述，定義狀態 $S(n)$ 為以第 $n$ 個數為**結尾**的 LIS **長度**， > 意思是在 $a_1, a_2, .., a_n$ 之間找個一定要包含 $a_n$ 的 LIS 且狀態轉移方程為 $S(n) = \max\{S(i) + 1 \mid i < n, a_i < a_n\}$ >也就是找出所有在 $a_n$ 之前的遞增子序列，選出最長的若找不到 $a_n$ 之前的遞增子序列，邊界為 $S(n) = 1$ ```cpp for (int n = 1; n <= N; n++) { // N 為 a 的總長度 S[n] = 1, f[n] = n; for (int i = 1; i <= n; i++) if (a[i] < a[n] && S[n] < S[i] + 1) { S[n] = S[i] + 1; f[n] = i; // 紀錄遞增子序列 } } ``` 複雜度為 $O(N^2)$ 其中 `f[n]` 代表遞增子序列中 `a[f[n]]` 下個接 `a[n]` 例如 $a = (\textbf{1}, 4, \textbf{2}, \textbf{3}, \textbf{8}, 3, 4, 1, \textbf{9})$ 得出 $f = (\textbf{1}, 1, \textbf{1}, \textbf{3}, \textbf{4}, 3, 4, 8, \textbf{5})$ 所以利用 `f` 就能將其中一個 LIS 輸出！ $a_9 = \textbf{9}$ 為末項的 LIS 為例： $f_9 = 5 \rightarrow a_5 = \textbf{8}$ $f_5 = 4 \rightarrow a_4 = \textbf{3}$ $f_4 = 3 \rightarrow a_3 = \textbf{2}$ $f_3 = 1 \rightarrow a_1 = \textbf{1}$ $f_1 = 1$ > $f_i = i$ 表示 $a_i$ 為欲輸出的 LIS 首項  [^2]: 子子問題就是指從子問題直接分割出來的更小子問題 [^3]: 子問題而非子子問題也非子子..子問題