# 【C++】競程筆記(多維 DP、LCS 最長共同子序列)
[TOC]
題目範例參考:NTUCPC Guide,此筆記僅為個人學習用途。
## 什麼是多維的 DP?
一開始入門 DP 所寫的全都是一維的 DP,例如在爬樓梯問題, $dp[i]$ 就表示成到達第 $i$ 階的方法數。
而當中只有一個變數,叫做 $i$ ,故稱為一維 DP。
多維的 DP 就是有多個變數的 DP,一個變數不足以清楚描述當前的子問題,需要兩個或更多的變數來鎖定狀態。
例如:
- 走迷宮需要 $x, y$ 座標兩個變數來表示 $dp[x][y]$
- LCS(Longest Common Subsequence:最長共同子序列)需要字串 A 的位置 $i$ 和字串 B 的位置 $j$ 表示 $dp[i][j]$
- 背包問題:需要物品編號 $i$ 和剩餘重量 $w$ 表示 $dp[i][w]$
## Vacation
Problem Source:https://atcoder.jp/contests/dp/tasks/dp_c
狀態定義:不能只紀錄 $dp[i]$ 代表第 $i$ 天的最大快樂值,因為要知道第 $i$ 天到底做了什麼活動,才能決定第 $i+1$ 天不能做什麼。
這邊可以應用多維 DP 的想法,擠在同一個 DP 裡面:
- $dp[i][0]$ :第 $i$ 天選擇活動 A 的最大總快樂值。
- $dp[i][1]$ :第 $i$ 天選擇活動 B 的最大總快樂值。
- $dp[i][2]$ :第 $i$ 天選擇活動 C 的最大總快樂值。
但也可以分成三個 dp 去宣告做狀態定義:
- $dpa[i]$
- $dpb[i]$
- $dpc[i]$
用哪一個都沒差,最後寫法還是一樣。
轉移式定義:
- $dp[i][0] = a[i] + \max(dp[i-1][1], dp[i-1][2])$
- $dp[i][1] = b[i] + \max(dp[i-1][0], dp[i-1][2])$
- $dp[i][2] = c[i] + \max(dp[i-1][0], dp[i-1][1])$
如果今天選 A,那昨天一定只能選 B 或 C(取昨天兩者中較大的一個)。
如果今天選 B,那昨天一定只能選 A 或 C。
如果今天選 C,那昨天一定只能選 A 或 B。
題目限制兩天不能做一樣的事情。
base case 初始狀態:
- $dp[0][0] = a[0]$
- $dp[0][1] = b[0]$
- $dp[0][2] = c[0]$
在 NTUCPC Guide 中採取的是後者:
```cpp=
#include <iostream>
#include <algorithm>
using namespace std;
int main(){
ios::sync_with_stdio(false), cin.tie(nullptr);
const int MAXN = 100005;
int a[MAXN], b[MAXN], c[MAXN];
int dpa[MAXN], dpb[MAXN], dpc[MAXN];
int n;
cin >> n;
for (int i = 1; i <= n; ++i){
cin >> a[i] >> b[i] >> c[i];
}
for (int i = 1; i <= n; ++i){
dpa[i] = max(dpb[i - 1] + a[i], dpc[i - 1] + a[i]);
dpb[i] = max(dpa[i - 1] + b[i], dpc[i - 1] + b[i]);
dpc[i] = max(dpa[i - 1] + c[i], dpb[i - 1] + c[i]);
}
// 三個及以上變數取最大值用 {}
cout << max({dpa[n], dpb[n], dpc[n]}) << '\n';
}
```
用多維 DP 的好處是,可以將這些繁瑣的步驟用迴圈去跑,不用一個一個寫轉移式。(code from [NTUCPC Guide](https://guide.ntucpc.org/BasicDynamicProgramming/multidimensional/))
```cpp=
#include <iostream>
#include <algorithm>
using namespace std;
const int MAXN = 100005;
int happiness[MAXN][3];
int dp[MAXN][3];
int main() {
ios::sync_with_stdio(0), cin.tie(0);
int n;
cin >> n;
for (int i = 1; i <= n; ++i)
for (int j = 0; j < 3; ++j)
cin >> happiness[i][j];
for (int i = 1; i <= n; ++i) {
for (int j = 0; j < 3; ++j)
for (int k = 0; k < 3; ++k)
if (j != k)
dp[i][j] = max(dp[i][j], dp[i - 1][k] + happiness[i][j]);
}
cout << *max_element(dp[n], dp[n] + 3) << "\n";
}
```
## 股票買賣 V
Problem Source:https://www.luogu.com.cn/problem/U425829
先前的做法是先定義好狀態跟轉移式,之後再透過整理轉移式得到 $O(n)$ 解。
但學會多維 DP 後,可直接得到 $O(n)$ 解,省去整理轉移式的麻煩。
狀態定義:
- $dp[i][0]$ :有股票。可能是今天剛買的,或者之前買了還沒賣。
- $dp[i][1]$ :剛賣出股票。今天賣出,導致明天進入冷凍期。
- $dp[i][2]$ :沒股票且非冷凍期。可能是昨天就沒股票,或者昨天是冷凍期今天解凍了,是隨時可以買入的狀態。
轉移式定義:
- 持有股票的狀態, $dp[i][0]$
- 狀況 A:昨天就持有股票,今天不賣 $\rightarrow dp[i-1][0]$
- 狀況 B:昨天沒股票也沒被冷凍,今天買入 $\rightarrow dp[i-1][2] - prices[i]$
$$dp[i][0] = \max(dp[i-1][0], dp[i-1][2] - prices[i])$$
- 剛賣出股票 $dp[i][1]$
- 昨天持有股票,今天賣掉。
$$dp[i][1] = dp[i-1][0] + prices[i]$$
- 沒股票且非冷凍期 $dp[i][2]$:
- 狀況 A:昨天沒買股票,繼續觀望 $\rightarrow dp[i-1][2]$
- 狀況 B:昨天剛賣出,今天強制休息(冷凍期) $\rightarrow dp[i-1][1]$
$$dp[i][2] = \max(dp[i-1][2], dp[i-1][1])$$
初始狀態定義,第 0 天(第一筆資料):
- $dp[0][0]$(持有):只能是當天買入,利潤為負 $\rightarrow -prices[0]$
- $dp[0][1]$(剛賣):第一天不可能賣出,設為極小值或 0(邏輯上不可能發生) $\rightarrow 0$
- $dp[0][2]$(沒股票、冷凍期):第一天什麼都不做 $\rightarrow 0$
範例程式碼:
```cpp=
#include <iostream>
#include <algorithm>
using namespace std;
int main() {
ios_base::sync_with_stdio(false), cin.tie(nullptr);
int N;
cin >> N;
int prices[N + 5];
for (int i = 0; i < N; ++i) cin >> prices[i];
int dp[N + 5][3];
dp[0][0] = -prices[0];
dp[0][1] = 0;
dp[0][2] = 0;
for (int i = 1; i < N; ++i) {
dp[i][0] = max(dp[i-1][0], dp[i-1][2] - prices[i]);
dp[i][1] = dp[i-1][0] + prices[i];
dp[i][2] = max(dp[i-1][1], dp[i-1][2]);
}
cout << max(dp[N-1][1], dp[N-1][2]) << '\n';
return 0;
}
```
## 組合數
Problem Source:https://www.luogu.com.cn/problem/U159710
這題是關於組合數 $C(n, m)$ 的計算。
組合公式:$$C(n, m) = \frac{n!}{m!(n-m)!}$$
計算階乘是非常慢的,而且題目的查詢量 $q$ 有到 $10^4$ ,因此改用二維 DP 結合帕斯卡三角形來做: $$C^n_m = C^{n-1}_m + C^{n-1}_{m-1}$$
狀態定義:定義 $dp[i][j]$ 為從 $i$ 個元素中選出 $j$ 個的方法數,也就是 $C(i, j)$。
轉移式定義:
根據帕斯卡三角形的性質「從 $i$ 個元素選 $j$ 個」的方法數等於以下兩者之和:
- 不包含第 $i$ 個元素:前 $i-1$ 個裡面選 $j$ 個 $\rightarrow dp[i-1][j]$
- 包含第 $i$ 個元素:前 $i-1$ 個裡面選 $j-1$ 個 $\rightarrow dp[i-1][j-1]$
因此得到完整的轉移式:$$dp[i][j] = (dp[i-1][j-1] + dp[i-1][j]) \pmod{10^9 + 7}$$
初始狀態定義:選 0 個,從任意 $i$ 個元素中選 0 個,只有一種方法(都不選)。$$dp[i][0] = 1$$
由於是有多筆查詢,而且 N 數量較少,所以改成直接建表,之後每筆查詢都能用 $O(1)$ 時間做到。
範例程式碼:
```cpp=
#include <iostream>
#include <vector>
using namespace std;
const int MOD = 1e9 + 7;
const int MAXN = 1005;
int dp[MAXN][MAXN];
int main() {
ios_base::sync_with_stdio(false), cin.tie(nullptr);
for (int i = 0; i <= 1000; i++) {
dp[i][0] = 1; // C(n, 0) = 1
for (int j = 1; j <= i; j++) {
// 帕斯卡三角形公式 C(n, m) = C(n-1, m-1) + C(n-1, m)
dp[i][j] = (dp[i-1][j-1] + dp[i-1][j]) % MOD;
}
}
int q;
cin >> q;
while (q--){
int n, m;
cin >> n >> m;
cout << dp[n][m] << '\n';
}
return 0;
}
```
## 最長共同子序列(Longest Common Subsequence, LCS)
LCS 是非常經典且重要的演算法問題,特別在字串處理、生物資訊學(DNA 比對)以及版本控制系統(Git 的 diff 功能)等中都有廣泛應用。
那這也是很經典的 DP 例題,非學不可。
### 子字串 vs. 子序列
- 子字串(Substring):必須是連續的。
- 例如:"ABCDE" 的子字串是 "BCD"。
- 子序列(Subsequence):不一定要連續,但先後順序不能改變。
- 例如:"ABCDE" 的子序列可以是 "ACE" 或 "BD"。
### LCS 定義
給定兩個序列(字串)$S1$ 和 $S2$,找出一個最長的序列,同時出現在 $S1$ 和 $S2$ 中。
假設有兩個字串 A、B:
- 字串 A:`"ABCBDAB"`
- 字串 B:`"BDCABA"`
它們的 LCS 是 `"BCBA"`。
LCS 可能不只一個,如 `"BDAB"` 也是長度為 4 的共同子序列,但通常求的都是「最長的長度」。
### 818 . Longest Common Subsequence
Problem Source:https://oj.ntucpc.org/problems/818
1. 狀態定義: $dp[i][j]$ 代表「字串 A 的前 $i$ 個字元」與「字串 B 的前 $j$ 個字元」 的 LCS 長度。
當 $i=0$ 時,代表字串 A 取了 0 個字元(空字串)。
當 $i=n, j=m$ 時, $dp[n][m]$ 即為兩完整字串的 LCS 長度。
2. 轉移式定義
- 字元相同:如果 $A$ 的第 $i$ 個字元等於 $B$ 的第 $j$ 個字元($A[i-1] = B[j-1]$),該字元必屬於 LCS 的一部分。 $$dp[i][j] = dp[i-1][j-1] + 1$$
- 字元不同: $A[i-1] \neq B[j-1]$ ,兩字元無法同時成為 LCS 的結尾。 $$dp[i][j] = \max(dp[i-1][j], \quad dp[i][j-1])$$
至於字元不同的情況,那 $A[i]$ 和 $B[j]$ 不可能同時被選入當作結尾,此時有兩種選擇:
- $A[i]$ 沒用,把它丟掉 $\rightarrow$ 問題變成找 「$A$ 的前 $i-1$ 個」跟「$B$ 的前 $j$ 個」。
- $B[j]$ 沒用,把它丟掉 $\rightarrow$ 問題變成找 「$A$ 的前 $i$ 個」跟「$B$ 的前 $j-1$ 個」。
在這兩種選擇中取兩者中的最大值,因為要求 LCS。
3. 初始狀態定義 $$dp[0][j] = 0, \quad \text{for } 0 \le j \le m$$ $$dp[i][0] = 0, \quad \text{for } 0 \le i \le n$$
範例程式碼:
```cpp=
#include <iostream>
#include <string>
#include <algorithm>
using namespace std;
const int MAXN = 5005;
int dp[MAXN][MAXN];
int main() {
ios::sync_with_stdio(false), cin.tie(nullptr);
string A, B;
cin >> A >> B;
int n = A.length();
int m = B.length();
for (int i = 1; i <= n; i++){
for (int j = 1; j <= m; j++){
if (A[i - 1] == B[j - 1]){
dp[i][j] = dp[i - 1][j - 1] + 1;
} else{
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
}
}
}
cout << dp[n][m] << '\n';
return 0;
}
```
### 更高維度的 DP:a252. Another LCS
Problem Source:https://zerojudge.tw/ShowProblem?problemid=a252
從二維的 DP 變成三維 DP。
解法跟二維 DP 的 LCS 差不多,需注意 $A[i - 1] = B[j - 1] = C[k - 1]$ 。
範例程式碼:
```cpp=
#include <iostream>
#include <string>
#include <algorithm>
using namespace std;
const int MAXN = 105;
int dp[MAXN][MAXN][MAXN];
int main() {
ios::sync_with_stdio(false), cin.tie(nullptr);
string A, B, C;
cin >> A >> B >> C;
int n = A.length();
int m = B.length();
int l = C.length();
for (int i = 1; i <= n; i++){
for (int j = 1; j <= m; j++){
for (int k = 1; k <= l; k++){
if (A[i - 1] == B[j - 1] && B[j - 1] == C[k - 1]){
dp[i][j][k] = dp[i - 1][j - 1][k - 1] + 1;
} else{
int maxVal = dp[i-1][j][k];
maxVal = max(maxVal, dp[i][j - 1][k]);
maxVal = max(maxVal, dp[i][j][k - 1]);
dp[i][j][k] = maxVal;
}
}
}
}
cout << dp[n][m][l] << '\n';
return 0;
}
```