Classic DP - HackMD

- - Sharing URL
  - /edit
  - View mode
    
    Edit mode
    
    View mode
    
    Book mode
    
    Slide mode
    Edit mode View mode Book mode Slide mode
  - Customize slides
  - Note Permission
  - Read
    Owners
    
    Signed-in users
    
    Everyone
    Owners Signed-in users Everyone
  - Write
    Owners
    
    Signed-in users
    
    Everyone
    Owners Signed-in users Everyone
  - Engagement control Commenting, Suggest edit, Emoji Reply
- Invite by email
  
  Invitee
  
  This note has no invitees
- Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note
  
  Your note will be visible on your profile and discoverable by anyone.
  
  Your note is now live.
  
  This note is visible on your profile and discoverable online.
  
  Everyone on the web can find and read all notes of this public team.
  
  See published notes
  
  Unpublish note
  
  I agree to HackMD’s Community Guideline. Please check the box to agree to the Community Guidelines.
  
  View profile
- Commenting
  Permission
  Disabled Forbidden Owners Signed-in users Everyone
- Enable
- Permission
  Forbidden
  
  Owners
  
  Signed-in users
  
  Everyone
- Suggest edit
  
  Permission
  Disabled Forbidden Owners Signed-in users Everyone
- Enable
- Permission
  Forbidden
  
  Owners
  
  Signed-in users
- Emoji Reply
- Enable

Owned this note Owned this note

<style> .reveal .slides { text-align: left; font-size:32px; } </style> # Classic DP Introduction to Competitive Programming 3/13 --- - Classic DP Problems - 複習基本DP - 01背包 vs 無限背包 - 有限背包 & 二進制拆分 - Subset Sum - $O(nlog(n))$ LIS - Edit Distance - LCS 轉 LIS - 滾動 --- ## DP Review ---- DP在幹嘛? 切割子問題，壓成狀態，求解。 DP能幹嘛? 計數，找最佳解。 ---- 我要怎麼切割子問題? 一個常見的手法就是對集合狀態下手像背包問題 $$dp(S) \leftarrow dp(\{x\}\backslash S)$$ 這就是取或不取 $x$ 來做轉移 ---- 可是這樣會有 $O(2^n)$ 的狀態 ( $n$ 是物品個數)，但我們可以發現一個物品取或不取是沒有順序問題的，因此我們可以只考慮物品在任意的排序 (對第 $n$ 個物品而言順序沒差)下前 $n-1$ 個物品的答案，就能轉移考慮前 $n$ 個物品的答案。我們就能這樣轉移 $$dp_n \leftarrow dp_{n-1}$$ 此時狀態就會降到 $O(n)$ (負重自己列) ---- 但如果今天是考慮的答案會受取的順序而影響，狀態是不一定能壓下來的，詳見之後的 Bitmask DP。我們還有很多堂課可以見面 :D --- ## 01背包 vs 無限背包 vs 有限背包 ---- 背包:具有負重上限 $W$，拿的東西總重不超過 $W$。問能拿的最大物品價值和。 0/1背包:每個物品拿或不拿，且至多拿一個。無限背包:可以拿不只一個，可以一直拿。有限背包:物品限量，最多拿某個量個物品。 ---- 0/1背包: 希望各位都記得，不過這邊複習一下滾動。基本轉移 ```cpp for(int i = 1; i <= n;++i){ for(int w = c[i]; w <= W;++w) dp[i][w] = max(dp[i][w],dp[i-1][w-c[i]]+v[i]); //dp[i][w] 考慮物品1~i且負重上限為w的答案。 } ``` ---- 滾動: $dp[i][w]$ 要轉移過來只會用 $dp[i-1][w-c_{i}]$ 又 $c_{i} > 0 \ s.t. \ w-c_{i} < w$ 讓 $w$ 從大到小遍歷，這樣就不會讓 $dp'[w-c_{i}]$是由第$i$個物品轉移的，所以這樣就會是合法轉移。 ```cpp for(int i = 1; i <= n;++i){ for(int w = W; w >= c[i];--w){ dp[w] = max(dp[w],dp[w-c[i]]+v[i]); } } ``` ---- 無限背包: 既然能一直取，我們只要考慮當前重量 $w$ 所有轉移的可能性就好了，那就是全部東西都拿拿看。 ```cpp for(int w = 0; w <= W;++w){ for(int i = 1; i <= n;++i){ dp[w] = max(dp[w],dp[w-c[i]]+v[i]); } } ``` --- ## 有限背包 & 二進制拆分 ---- ## 有限背包第 $i$ 個物品能取至多 $k_{i}$ 個，把他看成0/1背包，也就是有 $\sum k_{i}$ 個物品，這樣複雜度會是 $O((\sum k_{i}) * W)$ 有點爛。 ---- ## 二進制拆分把 $K = k_{i}$ 個物品分成 $1個、2個、4個、8個、\cdots、2^{\lfloor{logK}\rfloor-1}$個為一組和一組$K-(1+2+4+8+\cdots+2^{\lfloor{logK}\rfloor-1})$個的。剛好能在dp上窮舉取 $0,1,\cdots ,k_{i}$ 個第 $i$ 個物品的所有可能性。 ---- here's why: $1、2、4、8、\cdots、2^{\lfloor{logK}\rfloor-1}$的取或不取剛好能湊出 $[0,2^{\lfloor{logK}\rfloor}-1]$ 間的所有整數加上 $K-(1+2+4+8+\cdots+2^{\lfloor{logK}\rfloor-1}) = K-(2^{\lfloor{logK}\rfloor}-1)$ 則可湊出 $[K-(2^{\lfloor{logK}\rfloor}-1),K]$間的所有整數。又因為 $K-(2^{\lfloor{logK}\rfloor+1}) \leq -1$ 所以 $(K-(2^{\lfloor{logK}\rfloor}-1)) -(2^{\lfloor{logK}\rfloor}-1) \leq 1$ 聯集起來就是 $[0,K]$。這技巧叫二進制拆解，哪都能用 ( 我不會構造題 😭 ) 。 ---- 範例Code $i*2 \leq k \rightarrow i \leq 2^{\lfloor{logK}\rfloor-1}$ ```cpp #define pp pair<int,int> #define PB push_back int s = 0; vector<pp> A; //目前物品最多拿 k 個 for(int i = 1; i * 2 <= k; i *= 2){ s += i; A.PB({i*w,i*c}); // i 個一綑 } A.PB({(k-s)*w,(k-s)*c}); //最後一組 ``` ---- 會二進制拆解後就能以 $O(N*logK*W)$ 的複雜度把有限背包當0/1背包做。 *等價$N\lfloor{logK}\rfloor$個物品* --- ## Subset Sum ---- ## Subset Sum 給你一個集合 $S = \{A_{1},A_{2}, \cdots ,A_{n}\}$ 再給你一個 $K$ 問你是否有個子集 $Q \subseteq S$ 使得 $\sum_{Q} A_{i} = K$ ex. S = {1,2,3}, K = 5 那 K = 2 + 3, 所以可以湊出來 ---- 假設 $\sum_{S}A_{i} \leq 10^6$ 同樣地這也是個取跟不取的問題所以我們能輕鬆的列出轉移式 ```cpp vector<bool> dp(MXW+1); dp[0] = 1; // 0 就是不取東西就能湊出來 for(int i = 0; i < n;++i){ for(int w = MXW; w >= A[i]; --w){ dp[w] = dp[w] | dp[w-A[i]]; //dp[w] : w 這個數能不能被湊出來 } } ``` 但你會發現這樣轉移好像有點慢 $O(n*MXW)$ ---- 你會發現我們只需要知道 w 這個數能不能湊出來只要存 0/1 就好。這時就能用bitset (空間$\div 32$) 然後用bitset就能把第二圈壓掉。你會發現當bitset長這個樣子 ```cpp // 0 1 2 3 4 5 6 7 8 9 A bs = {1 1 0 0 1 0 0 0 0 0 0} //能湊出的數: 1、4 (bs<<5) = {0 0 0 0 0 1 1 0 0 1 0} //再多考慮 5 這個數時 5、6、9 就能被湊出來 ((bs<<5)|bs) = {1 1 0 0 1 1 1 0 0 1 0} //所以考慮 5 時這個bitset會變這樣 ``` 也就是第二圈轉移能用bitset的位元運算壓掉因為當下能湊出數字為 bs 時 (bs << x) 指一定要取 x 這個數後能湊出的所有數 (在 bs 的第 i 個位置為 1 的數，在 (bs << x) 裡會在 x + i 為 1) bs | (bs << x) 就是取跟不取都考慮到 ---- 轉移就會變這樣 ```cpp const int MXW = 1e6; bitset<MXW> dp; // bitset記得要開常數 dp[0] = 1; for(int i = 0; i < n;++i){ dp = (dp<<A[i]) | dp; } ``` 而這個位元運算就能把複雜度變這樣 $O(n*MXW/ 32)$ bitset很多運算都非常快，如果你發現複雜度卡在 1e9 之類的你就嘗試看看bitset，因為能直接快32倍。 --- 等等要吞證明，休息一下 --- ## $O(nlog(n))$ LIS ---- ## $O(nlog(n))$ LIS 複習，對於一個序列 $A,|A| = n$ , 以 $A_i$ 為結尾的LIS長度為 $$L_i = max(L_j)+1 \ where \ (i>j \land A_i > A_j)$$ 當 $A_i$ 在找 $A_j$ 時，不妨把 $A_{1,\cdots,i-1}$ 排序使得 $p$ is a permutation of $(1,\cdots,i-1)$ $s.t.$ $$A_{p_1} \leq A_{p_2} \cdots \leq A_{p_{i-1}} \quad and \quad A'=(A_{p_1},\cdots,A_{p_{i-1}})$$ $let$ $k = lowerbound(A',A_{i})$ 這樣符合 $A_i > A_j$ 的 $j$ 就會是 $j \in S = \{p_{1},\cdots,p_{k-1}\}$ 接下來只要找到屬於這個 $S$ 的 $j$ 中最大的 $L_{j}$ 我們就能轉移了。 ---- 我們不妨觀察一下這個集合，會發現當 $A_{x} \leq A_y$ $\land$ $L_x \geq L_y$ where $x,y \in S \land x\neq y$ 此時能從 $y$ 轉移的值都能由 $x$ 轉移，因此我們能把 $y$ 丟掉。所以對於一個任意的 $L_j$ 值，我們只要留最小的 $A_j$，因此一個 LIS長度只會對到唯一一個 $A_j$。以及 $L_{x} < L_{y} \rightarrow A_x < A_y$ $(x\neq y)$ 反證一下，因為當 $A_x \geq A_y$ 時 $x$ 就會被丟掉。根據以上關係我們能構建一個序列 ($L=1 \cdots LIS$都會出現恰巧一次)。 $dp_{(L=1)} = A_{p'_{1}} ,dp_{(L=2)} = A_{p'_{2}} \cdots,dp_{(L=LIS)} = A_{p'_{LIS}}$ ---- 然後同樣手法 $$A_{p'_1} < A_{p'_2} \cdots < A_{p'_{LIS}}$$ $$dp=(A_{p'_1},\cdots,A_{p'_{LIS}})$$ $$let \ k = lowerbound(dp,A_{i})$$ $L_{j}=k-1$ 就是我們要找的轉移值 ---- 接下來要把 $A_{i},$ $L_{i}=k-1+1$ 也丟進 $dp$ 維護會發現 $A_{i}$ 如果要出現在 $dp$ 裡只能在 $dp_k$ 的位子 1. 如果 $dp_{k}$ 沒值 (也就是 $k > LIS$) 那 $dp_{k}$ 就會是 $A_{i}$。 2. 否則 $dp_{k}$ 就是由左邊過來第一個大於等於$A_{i}$的值，根據前面的證明，我們就能把原本的 $dp_{k}$丟掉，所以$dp_k$也會變成$A_{i}$。所以結論就是 $dp_{k} := A_{i}$ ---- 範例Code ```cpp #define PB push_back #define all(v) (v).begin(), (v).end() vector<int> dp; for(int i = 0; i < n;++i){ auto it = lower_bound(all(dp),A[i]); if(it == dp.end()){ dp.PB(A[i]); }else{ *it = A[i]; } } cout << dp.size() << '\n'; ``` --- ## Edit Distance ---- ## Edit Distance 給你兩個字串 $S,T$ ，每次可以刪除、替換、插入一個字，問你最少的步驟數使得兩字串相等。 ex. S = abc T = aecc 把 T 的 e 刪掉 -> T = acc 然後再把中間的 c 換成 b -> T = abc = S 這樣就是兩步，且是最少。 ---- 在討論序列問題時我們時常考慮做完前$i$個的case來做轉移，像LIS就是 $dp[i] =$ 考慮$A_{1\sim i}$序列的最大答案來轉移。所以我們不妨考慮再只看 $S$ 的前 $i$ 個字元和 $T$ 的前 $j$ 個字元時答案 $let \ n = |S|, m = |T|$ $dp[i][j] = 把\ S[1...i]\ 和\ T[1...j]\ 變成一樣字串的最少步驟$ 則 $dp[n][m]$ 就會是我們要的答案 ---- 轉移: 1. 刪除操作: 如果刪除 $T_{j}$ 則，$dp[i][j] = dp[i][j-1] + 1$ 因為你可以這樣看字串: ![image](https://hackmd.io/_uploads/HkFkoXynyg.png) 所以不管刪除是沒後效性的，(別自己把字串並上去) 刪除 $S_{i}$ 是等價的 ---- 2. 插入操作: 那要插哪個字，要插在哪? 假設你亂插，那只為徒增把 $S$ 變成 $T$ 的成本，所以我們想必是插一個對方沒有的字元: ![image](https://hackmd.io/_uploads/Hk-127J2ke.png) 接下來有個問題: 那插入後不是會讓整個字串變長嗎這樣狀態不就會一直長? ---- 對，但不對如果你把一個字元插在 $T_{j}$ 的位子那原本的 $T_{j}$ 會跑到 $T_{j+1}$ 但你先不要讓他跑，你不必真的插入，根據前面我們會插一個 $S$ 有的字元，那我們就插 $S_{i}$ 到 $T_{j}$ 的位子，你會發現這樣在情況下，$S_{i} = T_{j}$ 那此轉移就會是 $dp[i-1][j-1]+1$ 但因為我們沒有真的把字元插進去，所以等價 $T$ 是不變的，但我們變相的用插入的動作刪掉 $S_{i}$，所以轉移就變 $dp[i][j] = dp[i-1][j]+1$ 跟前面的刪除 $S_{i}$ 的轉移是一樣的。 ---- 3. 替換操作: 等價你刪掉一個字再把一個字插回去，但成本只算你一次 ![image](https://hackmd.io/_uploads/Bk1j07J2Jx.png) 那把 $T_{j}$ 換成$S_{i}$ 後我們只要看 $1 \cdots i-1$ 和 $1 \cdots j-1$ $dp[i][j] = dp[i-1][j-1]+1$ ---- 這樣我們就都列完了，但有個問題就是初始狀態怎麼開? 對於 $dp[0][j]$ 而言，$0$ 個字元變成 $j$ 個那成本就是 $j$ 所以全部合起來就變: ```cpp //我懶 #define forr(i,n) for(int i = 1; i <= n;++i) const int inf = 1e18; void solve(){ string S,T; cin >> S >> T; int n = S.size(); int m = T.size(); S.insert(S.begin(),'$'); //把字串變 1-base T.insert(T.begin(),'$'); vector dp(n+1,vector<int>(m+1,inf)); dp[0][0] = 0; forr(i,n) dp[i][0] = i; //初始化 forr(j,m) dp[0][j] = j; forr(i,n) forr(j,m){ //記得從小到大轉移 if(S[i] == T[j]) dp[i][j] = dp[i-1][j-1]; //相等當然不用轉 else{ dp[i][j] = min({ dp[i-1][j] + 1, //刪除 Si 或插在 Tj dp[i][j-1] + 1, //刪除 Tj 或插在 Si dp[i-1][j-1] + 1, //替換 Tj 或 Si }); } } cout << dp[n][m] << '\n'; } ``` --- ## LCS to LIS ---- 先來複習 LCS 給你兩個字串 $S$、$T$ 問你最長共同子序列 (subsequence) * 子序列定義 : 對一於一個字串，他的子序列是通過刪除若干個或0個字元後將剩下字元在不改變原來的順序並起來的字串。 ex. abcde 的子序列有 ace 、ade 但 adc 不是。在過去的轉移方式和Edit Distance一樣，是考慮$S$、$T$的前綴子串的答案來轉移 $dp[i][j]=$ $S_{1 \cdots i}$ 和 $T_{1 \cdots j}$ 的最長共同子序列長度如果 $S_{i}=T_{j}$ 那 $dp[i][j] = dp[i-1][j-1] + 1$ 否則那 $dp[i][j] = max(dp[i-1][j],dp[i][j-1])$ ---- 我們觀察一下LCS會長怎樣 ( 圖中橘色的子序列 ) ![image](https://hackmd.io/_uploads/HJxhTBJh1l.png) ---- $n = |S| , m = |T|$ 考慮 $A = \{(i,j) \ where \ S_{i} = T_{j} \}$ 你會發現 LCS 會是最長的長得像這樣的序列 $b : (2,1) \ a : (3,3) \ c : (5,5)$ 沒錯，這就是依照二維偏序的遞增序列。 ---- 所以 LCS 就是你把$S$、$T$相同字元的index溝成的pair拿去做二維偏序的最長遞增子序列(LIS)。像前面那頁的，以 a 為共同字元構成的 pair 有$(1,3)、(1,6)、(3,3)、(3,6)$ 不過，二維LIS是啥鬼? ---- 你把 $(x,y)$ 照 $x$ 排序他就會變回看起來像一般的LIS ![image](https://hackmd.io/_uploads/ryuez81nJx.png) 但其實不全然，因為你得第一維也嚴格遞增 ( 不能拿到同一個 x ，這樣等同同個字元用兩次 ) 但字元不重複的情況下是好的 ( 當然 ) ---- 回顧2024李秀上的dp ![image](https://hackmd.io/_uploads/rJb2G81hkg.png =50%x) 事實上複雜度是有可能壓不下來的，因為在考慮到相同字母配對後，需要處理LIS序列長度就會回到$O(n^2)$的量級(如果相同字元太多)。所以這做法能幹嘛? ---- 處理排序的LCS。你會發現你可能開不了$|S| * |T|$的dp 但因為他是排序所以等價每個字元都只出現一次，這樣空間就壓掉了。 --- ## 滾動 ---- 為什麼要會滾動? <span>![image](https://hackmd.io/_uploads/HJrU_4J3yl.png) <br></span> <span>我在賽中沒有好好滾，一直用unodered_map開狀態 <br></span> ---- ![image](https://hackmd.io/_uploads/BJtTqVknkl.png) <span>結果就是我們在賽中TLE了3小時 : ( <br></span> ---- 好，所以怎麼好好滾? 其實重點就在狀態順序跟會不會重疊。最常見的例子就是前面的背包問題，也就是 $dp[i][一坨狀態]$ 從$dp[i-1][一坨狀態]$ 來，那我可以只保留 $dp[一坨狀態]$ 的資訊，因為你只需要知道你的上一個就好。那你不滾掉空間就是會大嘛，但還有一點，也就是我前面說的TLE的事情。 ---- 先來個簡單的 illustration ![image](https://hackmd.io/_uploads/HyCf6Vk21x.png) 假設下一個狀態的值域不會跟前一個狀態疊在一起，但你強行用 unodered_map 或 map 之類的裝 (以為會少) ---- 比方說 ```cpp= map<int,int> dp; for(int i = 0; i < n;++i){ map<int,int> ndp; for(auto [a,b]:dp){ for... 一坨轉移，並轉移到ndp上 } dp = ndp; } ``` 那這時候就有極大的可能會把上一個狀態的值域也遍歷到，複雜度就會呈現 $1+2+3+ \cdots + n = O(n^2)$ 但每個狀態的值域事實上是 disjoint(互不相交) 的，所以跑完轉移等於跑完整個所有狀態的聯集那複雜度其實是 $O(n)$ 由於目前主題有點難遇到這種事情發生 ( 通常會發生在樹背包、狀壓之類的 ) ---- 像這種需要好好分析值域的問題 (才能把複雜度壓下來)。 ```cpp= for(int a = min(rr,sz[x]); a >= -min(rr,sz[x]); --a) pd[a+ofs] = dp[x][a+ofs]; for(int a = -min(rr,sz[x]); a <= min(rr,sz[x]); ++a){ if(!pd[a+ofs]) continue; for(int b = -min(rr,sz[u]); b <= min(rr,sz[u]); ++b){ if((a+b+ofs) >= 2*ofs) continue; if(!dp[u][b+ofs]) continue; if((a+b) < -rr) continue; dp[x][(a+b)+ofs] += (1LL * pd[a+ofs] * dp[u][b+ofs]) % mod; dp[x][(a+b)+ofs] %= mod; } } ``` 但這部分比較複雜，今天就不分析，但這告訴我們狀態要好好算。目前的題目最多會用到的滾動就是把空間 $O(n*C) \to O(C)$。 --- 很多時候dp的正確性會比Greedy或數學題來的更好推，所以當你不知道Greedy是不是真的對的時候可以想想dp，以及特別的dp會在數值範圍上面有特徵，可以多看看題目給的數字範圍來推斷狀態要怎麼開。 --- 我放的有點小多，但蠻多水題的，寫一下嘛🥺 [題單連結](https://vjudge.net/contest/698248#overview)

Cheatsheet

Syntax	Example	Reference
# Header	Header	基本排版
- Unordered List	Unordered List
1. Ordered List	Ordered List
- [ ] Todo List	Todo List
> Blockquote	Blockquote
Bold font	Bold font
Italics font	Italics font
~~Strikethrough~~	~~Strikethrough~~
19^th^	19^th
H~2~O	H₂O
++Inserted text++	Inserted text
==Marked text==	Marked text
[link text](https:// "title")	Link
![image alt](https:// "title")	Image
`Code`	`Code`	在筆記中貼入程式碼
```javascript var i = 0; ```	`var i = 0;`	在筆記中貼入程式碼
:smile:		Emoji list
{%youtube youtube_id %}	Externals
$L^aT_eX$	L^aT_eX
:::info This is a alert area. :::	This is a alert area.