Sqrt Algorithm

--- type: slide --- <style> .reveal .slides { text-align: left; font-size:28px; } </style> # Sqrt-Decomposition ---- - Sqrt-Decomposition on Math - Sqrt-Decomposition the Case - Sqrt-Decomposition on Sequence - Mo's Algorithm ---- ## 根號題的數值 | 複雜度 | 題目範圍 | 實際大小 | | -------- | -------- | -------- | | $\sqrt{n}$ | $10^9\sim 10^{14}$ | $3\cdot 10^4\sim 10^7$ | | $n\sqrt{n}$ | $5\cdot 10^4\sim 3\cdot10^5$ | $10^7\sim 1.6\cdot 10^8$ --- ## 數論分塊 --- [UVa11526 H(n)](https://onlinejudge.org/index.php?option=onlinejudge&Itemid=8&page=show_problem&problem=2521) 數論分塊可以在 $O(\sqrt{n})$ 的複雜度計算一些除法向下取整的總和的式子 $f(n)$ $f(n) = \sum_{i=1}^{n}\limits {\lfloor\frac{n}{i}\rfloor}$ 以 $n = 13$ 為例 | <center>$i$</center> | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | | ---- | - | - | - | - | - | - | - | - | - | - | - | - | - | | $\lfloor\frac{n}{i}\rfloor$ | 13 | 6 | 4 | 3 | 2 | 2 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | ---- ## 範圍 $f(n) = \sum_{i=1}^{n}\limits {\lfloor\frac{n}{i}\rfloor}$ $1\le n \le 10^{12}$，顯然不能線性跑過去計算 ---- ## 先講結論 $\forall i = 1...n$，最多只有 $2\sqrt{n}$ 種不同的 ${\lfloor\frac{n}{i}\rfloor}$ ---- ![image.png](https://hackmd.io/_uploads/SJurjyeQp.png =550x) 可以發現當 $i\ge \sqrt{n}$ 時，$\lfloor\frac{n}{i}\rfloor$ 的值都 $\le \sqrt{n}$ ，也就是只有 $\sqrt{n}$ 種再加上所有 $i<\sqrt{n}$ 的，可以發現 $\lfloor\frac{n}{i}\rfloor$ 只有 $\sqrt{n}$ 種 ---- 最多只有 $2\sqrt{n}$ 個不同的值，因此只需要枚舉每個數字$\times$出現的次數總和即為答案，以 $n=13$ 為例 | <center>$i$</center> | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | | ---- | - | - | - | - | - | - | - | - | - | - | - | - | - | | $\lfloor\frac{n}{i}\rfloor$ | 13 | 6 | 4 | 3 | 2 | 2 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | $\sum_{i=1}^{n}\limits {\lfloor\frac{n}{i}\rfloor} = 13\times 1+6\times 1+4\times 1+3\times 1+2\times 2+1\times7$ ---- ## 枚舉數字與出現次數可以發現對於相同的 $\lfloor\frac{n}{i}\rfloor$ 為連續的，因此只須找到每個 $\lfloor\frac{n}{i}\rfloor$ 的區間即可而每個 $\lfloor\frac{n}{i}\rfloor$ 的右界位置在 $\lfloor\frac{n}{\lfloor\frac{n}{i}\rfloor}\rfloor$ 以 $\lfloor\frac{13}{i}\rfloor = 2$ 為例，出現的區間在 $i=5\sim 6$ ---- ## 過程因此我們只需從 $i = 1$ 開始，找到每個 $\lfloor\frac{n}{i}\rfloor$ 的右界計算總和，再從下一個 $\lfloor\frac{n}{i}\rfloor$ 繼續加入答案中 ```cpp= for(long long i = 1, r; i <= n; i = r+1){ r = n / (n/i); // 右界 ans += (n/i) * (r-i+1); // (n/i) * 次數 } ``` 而最多只有 $2 \sqrt{n}$ 個不同的 $\lfloor\frac{n}{i}\rfloor$，總複雜度 $O(\sqrt{n})$ --- ## 根號題 --- 分 case 處理類似於數論分塊，依照題目分成兩種 case 處理 $K = \sqrt{n}$，分成 - $i\le K$ - $i > K$ 兩個不同的範圍有不同的性質，根據性質分別做不同的計算在圖論的題目中，也有許多會用到此性質分 case 處理 ---- ## 經典題有 $n$ 個正整數 $a_1, a_2, a_3...,a_n$，且 $a_1+a_2+a_3+...+a_n=k$ 問是否可以選一些數字 $a_i$ 總合為 $x$ $1\le n, k, x\le 2\cdot 10^5$ ---- ## 經典 DP 題 ? <span>Subset sum !</span> <span>但複雜度呢?</span> <span>n 個數字總和最大為 k</span> <span>O(nk)</span> <span>:(</span> ---- ## 實際上把 $a_i$ 分成兩種 case: - $a_i\le \sqrt{k}$，這種 case 的 $a_i$ 種類不超過 $\sqrt{k}$ 種 - $a_i > \sqrt{k}$，這種 case 的 $a_i$ 不超過 $\sqrt{k}$ 個 ($a_1+a_2+a_3+...+a_n=k$) ---- ## $a_i\le \sqrt{k}$ 這種 case 的 $a_i$ 種類不超過 $\sqrt{k}$ 種此種情況可以統計每個數字出現次數，去做有限背包問題每種物品花 $O(k)$ 的時間做有限背包 $\to O(\sqrt{k}\times k\times \log{a_i})$ ---- ## $a_i> \sqrt{k}$ 由於題目限制 $a_1+a_2+a_3+...+a_n=k$ 這種 case 的 $a_i$ 不超過 $\sqrt{k}$ 個不超過 $\sqrt{k}$ 個物品做背包問題 $\to O(\sqrt{k}\times k)$ ---- 如此一來兩種 case 的複雜度分別為 $$ \begin{cases} O(k\sqrt{k}\times\log{a_i}) & a_i\le \sqrt{k}\\ O(k\sqrt{k}) & a_i> \sqrt{k} \end{cases} $$ 而在 $a_i\le \sqrt{k}$ 的 case 複雜度比較高，因此可以把 k 設小一點平衡一下複雜度 ---- 除此之外，$a_1+a_2+a_3+...+a_n=k$ 這種序列最多只會有 $\sqrt{k}$ 種不同的 $a_i$ $(1+2+3+...+\sqrt{k} = k$) 此性質也可以用在一些特殊的題目上 ---- ## 例題2 --- Count triangles in a graph 給一張 $n$ 個點 $m$ 條邊的簡單無向圖，求圖上有幾個三角形 (大小為 3 的環) $1\le n, m\le 10^5$ 經典圖上分 case 題 ---- 對於每個點 $v$，找出包括在幾個三角形內有以下兩種計算方式: - $O(m)$ 跑過所有邊，找出包括 $v$ 的三角形 - $O(d^2)$ 跑過 $v$ 的所有邊 pair，找出連接邊 pair 的第三條邊 ($d$ 為 $v$ 的 degree) 算出每個點所在三角形數量 /3 即為答案 ---- 一樣，用根號分 case 有甚麼條件可以分呢? ---- ## degree ! 對於 degree $\ge\sqrt{m}$ 的點，我們稱之為重點 $<\sqrt{m}$ 的點稱之為輕點 ---- ## 分 case 處理 - $O(m)$ 跑過所有邊，找出包括 $v$ 的三角形 degree $\ge\sqrt{m}$ 的點不超過 $\sqrt{m}$ 個對於這些點可以用這種方法處理，複雜度 $O(m\sqrt{m})$ - $O(d^2)$ 跑過 $v$ 的所有邊 pair，找出哪些 pair 可以形成三角形 degree $<\sqrt{m}$ 的點，degree 很小可以暴力 $O(d^2)$ 計算 ---- ## 實作細節 - 對於重點，$O(m)$ 跑過所有邊，找出包括 $v$ 的三角形可以先 $O(m)$ 跑過所有邊紀錄 $v$ 連到哪些點接著再 $O(m)$ 跑過一次所有邊，判斷哪些邊的點兩端點 $(x, y)$ 都有被記錄到(被 $v$ 連到) ```cpp= bool vis[MXN]; for(int i : heavy){ for(int j = 0; j < m; j++){ if(edges[j].first == i) vis[edges[j].second]=1; if(edges[j].second == i) vis[edges[j].first]=1; } for(int j = 0; j < m; j++){ ans += vis[edges[j].first] && vis[edges[j].second]; } for(int j = 0; j < m; j++){ if(edges[j].first == i) vis[edges[j].second]=0; if(edges[j].second == i) vis[edges[j].first]=0; } } ``` ---- ## 實作細節 - 對於輕點，$O(d^2)$ 跑過 $v$ 連到的任兩條邊連出去的點 x 和 y，找出哪些 pair$(x, y)$ 有連邊可以形成三角形如何找出所有 $(x, y)$ 是否有連邊? ---- ## 離線處理 ! 我們只需要知道有幾個 $(x, y)$ 有連邊即可加入答案 ---- 對於每個點，紀錄有連到哪些邊再跑過每個詢問點 $x$ 是否有連到 $y$ ```cpp= void addQuery(int x, int y){ query[x].push_back(y); } void calc(){ for(int i = 0; i < n; i++){ for(int j : edge[i]) vis[j] = 1; for(int j : query[i]) ans += vis[j]; for(int j : edge[i]) vis[j] = 0; } } ``` ---- ## 結論很多圖上根號分 case 的題目，由於邊的數量都是有上限的，可以用 degree 大小來區分，因此以外看到圖上計算每個節點與相鄰點之間關係的題目，都可以想一下是否可以分 case 處理 --- ## 序列分塊一種資料結構用於區間操作，區間詢問之類的問題 ---- 將序列分成每塊大小為$\lfloor \sqrt{n} \rfloor$，而總共$\lceil \frac{n}{ \lfloor \sqrt{n} \rfloor } \rceil$塊以 $n=10$ 為例每塊大小為$\lfloor \sqrt{n} \rfloor = 3$，總共 $\lceil \frac{n}{ \lfloor \sqrt{n} \rfloor } \rceil = 4$ 塊 ![](https://i.imgur.com/qxGdQk7.png) ```cpp= //分塊結構 //求區間總和 struct blk{ vector<int> local; //每塊的全部元素 int global; //儲存每塊的總和 int tag; //儲存整塊一起更新的值 blk(){ //初始化 local.clear(); //清空區間元素 tag = global = 0; //將區間總和先設為0 } }; ``` ---- ### 預處理 (求區間總和) ![](https://i.imgur.com/qxGdQk7.png) ```cpp= vector<blk> b; void build(){ int len=sqrt(n),num=(n+len-1)/len; for(int i=0;i<n;i++){ //第i個元素分在第 i/len 塊 cin>>x; //存入區間中 b[i/len].local.push_back(x); //更新區間總和 b[i/len].global += x; } } ``` ---- ### 區間加值區間 1~9 加值 5 ![](https://i.imgur.com/4jKHMz8.png) #### 最左塊        最左邊那塊每格暴力跑過去加值 #### 中間每塊        在中間每格的 TAG 加值 #### 最右塊        最右邊那塊每格暴力跑過去加值 ---- ### 區間加值 <div style="font-size:30px"> 假設區間 1~9 加值 5 ![](https://i.imgur.com/4jKHMz8.png) 會發現最右邊那塊裡面每格都有選到但是為了方便實作，因此最右邊那格會直接暴力加 </div> ---- <div style="font-size:30px"> ### 區間加值 (求區間總和) </div> <div style="margin-left:-120px"> ```cpp= void update(int ql,int qr,int v){ int blk_l=ql/len,blk_r=qr/len,ret=0; if(blk_l == blk_r){ //如果都在同一塊直接一個一個跑過去就好 for(int i=ql;i<=qr;i++) b[blk_l].local[i%len]+=v; b[blk_l].global+=(qr-ql+1)*v; return; } for(int i=ql;i<(blk_l+1)*len;i++){ //最左的那一塊 b[blk_l].local[i%len]+=v; b[blk_l].global+=v; } for(int i=blk_l+1;i<blk_r;i++){ //中間每塊 b[i].tag+=v; b[i].global+=v*len; } for(int i=blk_r*len;i<=qr;i++){ //最右的那一塊 b[blk_r].local[i%len]+=v; b[blk_r].global+=v; } } ``` </div> ---- ### 詢問 (假設要求區間總和) 做法與區間加值相同，分最左、中間每塊、最右以詢問區間 2-8 為例 ![](https://i.imgur.com/46JBrNw.png) ---- ### 詢問 (求區間總和) <div style="margin-left:-120px"> ```cpp= int query(int ql,int qr){ int blk_l=ql/len,blk_r=qr/len,ret=0; if(blk_l == blk_r){ //如果都在同一塊直接一個一個跑過去就好 for(int i=ql;i<=qr;i++) ret+=b[blk_l].local[i%len]+b[blk_l].tag; return ret; } for(int i=ql;i<(blk_l+1)*len;i++) //最左的那一塊 ret+=b[blk_l].local[i%len]+b[blk_l].tag; for(int i=blk_l+1;i<blk_r;i++) //中間每塊的總和 ret+=b[i].global; for(int i=blk_r*len;i<=qr;i++) //最右的那一塊 ret+=b[blk_r].local[i%len]+b[blk_r].tag; return ret; } ``` </div> ---- ## 複雜度分析 - 建表 $O(n)$，一個一個跑過去就好 - 更新最左的那塊裡面最多跑過 $\sqrt{n}$ 格中間跑過最多 $\sqrt{n}$ 大塊最右的那塊裡面最多跑過 $\sqrt{n}$ 格複雜度 $O(\sqrt{n})$ - 詢問同上複雜度 $O(\sqrt{n})$ ---- ### 結論分塊看起來複雜度比線段樹差但分塊用迴圈實作常數比較小(線段樹遞迴常數較大) 實際上大部分題目都還是可以過的 $n = 2 \cdot 10^5 ， n \sqrt{n} = 89,442,719$ 熟悉之後，實作複雜度不比線段樹高而且能解出更多線段樹解不出來的題目 --- ## 莫隊算法(mo's algorithm) 是2009年中國國家代表隊「莫濤」所提出來的一種運用到分塊概念的離線演算法 ---- ## 使用條件用於序列的區間詢問對於詢問的 $[l,r]$ 區間，如果已經計算好區間內的答案並且能在 $O(1)$ 或者 $O(\log N)$ 的複雜度內，計算轉移到區間的答案 $[l,r+1], [l,r-1], [l+1,r], [l-1,r]$ (即 $[l,r]$ 左界或右界移動一格) 則可以在$O(N\sqrt{N})$的複雜度內求出所有詢問的答案 ---- ### 引入問題 [SPOJ-DQUERY](https://www.spoj.com/problems/DQUERY/) 給你一個大小為 $n(n\le3 \cdot 10^4)$ 的序列 $a (1\le a_i\le10^6)$ $q(q\le200000)$ 筆詢問，每次問你區間 $[l,r]$ 內，有幾個不同的數字如果每次都直接暴力找，最差複雜度 $O(NQ) \rightarrow$ TLE ---- ## 作法將所有詢問分塊之後各自排序，依序暴力從前一個詢問區間計算完答案轉移到下一個詢問區間求出答案將所有詢問依照先依照左界 $l$ 去分塊， $\frac{l}{\lfloor\sqrt{n}\rfloor}$ 一樣的在同一塊，而同一塊的分別再各自用右界 $r$ 去排序 ```cpp= int n,k = sqrt(n); //每塊大小為k struct query{ int l,r,id; //詢問的左界右界以及第幾筆詢問 friend bool operator<(const query& lhs,const query& rhs){ return lhs.l/k==rhs.l/k ? lhs.r<rhs.r : lhs.l<rhs.l; } //先判斷是不是在同一塊不同塊的話就比較塊的順序，否則比較右界r }; ``` ---- ### 排序詢問假設序列長度為 $10 (i \in 0 \sim 9)$ ，每格大小為 $\lfloor\sqrt{10}\rfloor = 3$ 詢問有 [4, 8], [2, 3], [9, 9], [0, 7], [1, 2], [6, 9], [7, 8] 將詢問排序 (先比較塊的順序，再比較右界大小) [1, 2], [2, 3], [0, 7], [4, 8], [7, 8], [6, 9], [9, 9] ---- ### 暴力轉移從前一個區間轉移到下一個區間，每次移動一格以區間 [0, 7] 轉移到區間 [4, 8] [0, 7] $\to$ [0, 8] $\to$ [1, 8] $\to$ [2, 8] $\to$ [3, 8] $\to$ [4, 8] 一次新增/刪除一個元素 ---- ## 暴力轉移 ```cpp= int num = 0; int cnt[1'000'005], ans[30'005]; vector<query> q; void add(int index){ ... } //新增元素到區間內並更新數量 num void sub(int index){ ... } //從區間內移除元素並更新數量 num void solve(){ sort(q.begin(),q.end()); for(int i=0,l=0,r=-1;i<n;i++){ while(l>q[i].l) add(--l); while(r<q[i].r) add(++r); //記得要先做新增元素的 while(l<q[i].l) sub(l++); //再做移除元素的 while(r>q[i].r) sub(r--); ans[q[i].id] = num; //移到區間後儲存答案 } } ``` ---- #### 計算新增/刪除元素不同題目新增/移除元素做法不同，以例題來說給你一個大小為 $n(n\le3 \cdot 10^4)$ 的序列 $a (1\le a_i\le10^6)$ 每次問你區間 $[l,r]$ 內，有幾個不同的數字 ? 直接開一個值域大小的陣列 cnt[1000005]，計算每個數字出現的次數新增元素 add(x) 直接 cnt[x]+=1，並且判斷是不是原本為 0 ，若為 0 則個數 +1 移除元素 sub(x) 則為 cnt[x]-=1，移除後判斷是否變為 0 ，若為 0 則個數 -1 每次更新複雜度 $O(1)$ ---- #### 計算新增/刪除元素 ```cpp= void add(int x){ ++cnt[x]; if(cnt[x] == 1) ++num; } void sub(int x){ --cnt[x]; if(cnt[x] == 0) --num; } ``` ---- ## 複雜度分析 $n$ 為序列總長度， $q$ 為詢問比數， $p$ 為移動一格的複雜度 #### 左界 :::info 在同一塊裡，每次移動量最多為 $\sqrt{n}$，不同塊之間距離總和最多為 $n$ 因此移動總量為 $q\sqrt{n} + n$ ::: #### 右界 :::info 每塊裡面是遞增的，因此每塊裡面最多移動 $n$，有 $\sqrt{n}$ 塊而不同塊之間最多移動 $n$ ::: 移動加起來為 $q\sqrt{n} + n\sqrt{n} + n$ 複雜度為 $O(p(q+n)\sqrt{n})$ ---- ## 其他優化排序的時候，在同一塊的詢問區間會用右界排序而把相鄰分塊的右界大小關係交替 (小於$\to$大於$\to$小於$\to$大於) 就能省去一些常數的時間 ![](https://i.imgur.com/aI4AxbD.png =400x) ![image.png](https://hackmd.io/_uploads/SJlcovPQa.png) ```cpp= bool operator<(const query &lhs, const query &rhs){ if(lhs.l/k!=rhs.l/k) return lhs.l/k<rhs.l/k; return ((lhs.l/k)&1?lhs.r<rhs.r:lhs.r>rhs.r); // 奇數塊右界遞增，偶數塊右界遞減之類 } ``` --- ## 常數優化通常分塊、根號的題目的分塊大小會用常數決定，常見的大小會設成 400, 450, 500 等等 ```cpp= const int k = 400; ``` 而不是由輸入的大小決定 ```cpp= int k = sqrt(n); ``` 使用常數宣告的方法常數通常會比較小很多時候分塊 TLE 的時候也會直接調整分塊大小來避免一些特別產的測資大家可以測試看看分塊大小不同的速度差別 ---- ## 作業 deadline: 2 week https://vjudge.net/contest/591312

Syntax	Example	Reference
# Header	Header	基本排版
- Unordered List	Unordered List
1. Ordered List	Ordered List
- [ ] Todo List	Todo List
> Blockquote	Blockquote
Bold font	Bold font
Italics font	Italics font
~~Strikethrough~~	~~Strikethrough~~
19^th^	19^th
H~2~O	H₂O
++Inserted text++	Inserted text
==Marked text==	Marked text
[link text](https:// "title")	Link
![image alt](https:// "title")	Image
`Code`	`Code`	在筆記中貼入程式碼
```javascript var i = 0; ```	`var i = 0;`
:smile:		Emoji list
{%youtube youtube_id %}	Externals
$L^aT_eX$	L^aT_eX
:::info This is a alert area. :::	This is a alert area.