Linux 核心的紅黑樹

本頁由 steven1lung, linD026, jserv 貢獻

red-black tree (以下簡稱 rbtree 或紅黑樹) 是一種特別的自平衡樹，不僅其新增、移除、搜尋的時間複雜度均維持在

O (\log n)

，而樹高 (tree height) 的定義與尋常平衡樹不同 (紅黑樹用的是 black height)，後者使其重新平衡所需的時間成本較其他平衡樹小。

black height 的定義是，對於 bh(x)，從 x 到任何一個它後代到末端 (即 leaf) 節點的路徑上，遇到的標註為「黑」的節點個數 (不含自身)。

Linux 核心原始程式碼中，許多地方出現紅黑樹的蹤影，例如：hr_timer 使用紅黑樹來記錄計時器 (timer) 端發出的要求、ext3 檔案系統使用紅黑樹來追蹤目錄內容變更，以及於 Linux 預設 CPU 排程器 (CFS 和 EEVDF) ，由於需要頻繁地插入跟移除節點 (任務)，因此開發者選擇用紅黑樹 (搭配一些效能調整)。VMA（Virtual Memory Area）也用紅黑樹來紀錄追蹤頁面 (page) 變更，因為後者不免存在頻繁的讀取 VMA 結構，如 page fault 和 mmap 等操作，且當大量的已映射 (mapped) 區域時存在時，若要尋找某個特定的虛擬記憶體地址，鏈結串列 (linked list) 的走訪成本過高，因此需要一種資料結構以提供更有效率的尋找，於是紅黑樹就可勝任。

延伸閱讀: Red-black Trees (rbtree) in Linux

為何不選擁有同樣時間複雜度性質、同為

O (\log n)

的 AVL tree 呢？

在樹高性質上，AVL tree 和 rbtree 雖然都是

O (\log n)

，但 AVL 在樹高上較緊致，約

1.44 \times \log (n + 2)

，而 rbtree 則為

2 \times \log (n + 1)

。因此在搜尋等以樹高作為上限的操作下， AVL tree 會比 rbtree 略快，但這是建立在新增和移除需要更多旋轉 (rotate) 以維持樹高的情形（其中 AVL tree 為 3 次，rbtree 為 2 次）。也因此，對於一般實作，Linux 核心偏好採用 rbtree (但近年轉向本文後續探討的 "maple tree")，資料庫的實作會傾向採用 AVL tree。

相關討論: red-black tree over avl tree

儘管 rbtree 和 AVL tree 平均時間複雜度都是

O (\log n)

，但因行為和特性的落差，有著不同的應用場景，簡述如下:

平衡
- AVL tree 比紅黑樹要平衡（左右子樹的高度不能差超過 2），但會在平衡自身時花費比紅黑樹多的時間。
- 如果考慮到要更快速地去 search 一個節點，那 AVL tree 會比較適合。
- 紅黑樹的優點在於雖沒有到完全平衡 (最長路徑
  $\leq$ 2 倍最短路徑)，但是紅黑樹會在平衡自己時達到
  $O (1)$ (最多 3 次旋轉) 的複雜度。
空間
- AVL tree 的節點需要宣告 factor (height) 的變數給每個節點來作為平衡的參考，而紅黑樹只需要 1 位元的變數來區分顏色（紅、黑）。

簡化的判斷因素，讓我們依序場景來選擇自平衡樹:

插入跟移除較多：紅黑樹
查詢節點較多：AVL Tree

此外尚有一項考量:AVL tree 無法提供 amortized update cost，而 rbtree 則有。

對照 SortedSequences - section 7.4

關於效能表現的研究，可見〈Performance Analysis of BSTs in System Software〉，以下摘錄:

The results indicate that when input is expected to be randomly ordered with occasional runs of sorted order, red-black trees are preferred; when insertions often occur in sorted order, AVL trees excel for later random access, whereas splay trees perform best for later sequential or clustered access.

Linux 核心文件 Red-black Trees (rbtree) in Linux 提到:

Red-black trees are a type of self-balancing binary search tree, used for storing sortable key/value data pairs. This differs from radix trees (which are used to efficiently store sparse arrays and thus use long integer indexes to insert/access/delete nodes) and hash tables (which are not kept sorted to be easily traversed in order, and must be tuned for a specific size and hash function where rbtrees scale gracefully storing arbitrary keys).

說明不同資料結構適用場景：當輸入的 indexes 特性為之間的變化極大又偏向一邊，亦即每個 index 之間的差距都頗大的情況，應採用 radix tree，後者本質上是稀疏陣列，有用到的 indexes 才會建立其空間陣列，這也是為何核心文件強調 "must be tuned for a specific size"。在此情況中，若使用 rbtree 將遭遇大量旋轉，因為當資料都偏向一方時，rbtree 本身又是一個自平衡樹，為維護平衡就只能頻繁的旋轉，如此一來，時間開銷就相當可觀。然而，當採用的資料 indexes 浮動不大，rbtree 會是很好的選擇，因為無需事先配置陣列或記憶體。

用語

避免父權主義的遺毒，本文將 parent node 翻譯為「親代節點」，而非「父節點」或「母節點」，不僅更中性，也符合英文原意。若寫作「父」，則隱含「母」的存在，但以二元樹來說，沒有這樣成對關連性。若用「上代」會造成更多的混淆，在漢語中，「上一代」沒有明確的血緣關係 (例如「炎黃子孫」與其說是血緣關係，不如說是傾向文化認同)，但「親」的本意就是指名血緣和姻親關係。

延伸閱讀: 「新中國」和「中華民族」—— 梁啟超悔之莫及的發明

至於 sibling node，本文翻譯為「平輩節點」，而非「兄弟節點」。至於 parent's sibling node 則翻譯為「親代的平輩節點」，不用「叔伯節點」。前述用語儘量依循中性且明確的原則。

簡述紅黑樹

紅黑樹是 2-3-4 樹的變形，1978 年 Leonidas J. Guibas 和 Robert Sedgewick 發明最初的紅黑樹。2008 年 Sedgewick 做了改進，並將此命名為 LLRBT (Left-leaning red–black tree，即左傾紅黑樹)，後者相比 1978 年的紅黑樹要簡單，程式碼量更精簡，可參見 Left-leaning Red-Black Trees。

簡報: Left-Leaning Red-Black Trees
以下內容改寫自〈理解紅黑樹〉

Image Not Showing Possible Reasons

The image was uploaded to a note which you don't have access to
The note which the image was originally uploaded to has been deleted

	rbtree	Radix Tree	Maple Tree
RCU Safe	No	Yes	Yes
Range support	Yes	Limited	Non-overlapping
Tree height	Tall	Short*	Medium
API	Hard	Easy	Easy
Node	Embedded	External	External
Node size	24 bytes	576 bytes	128 bytes

Linux 核心的紅黑樹

用語

簡述紅黑樹

紅黑樹的插入

紅黑樹的移除

Linux 核心的紅黑樹實作

紅黑樹節點

container_of or rb_entry

rb_link_node

rb_insert_color

親代節點

顏色

簡單的紅黑樹例子

決定架構

Search 實作

Insert 實作

迭代紅黑樹里的節點

相關原始程式碼

Maple tree

Read more

Linux 核心設計: 不僅是個執行單元的 Process

你所不知道的 C 語言：指標篇

CS:APP 第 2 章重點提示和練習

你所不知道的 C 語言: linked list 和非連續記憶體

`container_of` or `rb_entry`

`rb_link_node`

`rb_insert_color`