contributed by < chloe0919
>
fibdrv: 可輸出 Fibonacci 數列的 Linux 核心模組
將 fibdrv.ko
核心模組掛載後觀察其行為,執行以下命令:
會輸出 511:0
,並且對照 fibdrv.c 觀察輸出的意思,可以看到以下程式中會利用 register_chrdev
讓 kernel 自動分配一個未被註冊的註冊號,並且用 if
進行錯誤處理
在 kdev_t.h 可以看到 MKDEV
巨集的定義,可以發現 MKDEV
就是將 ma
和 mi
進行一些 bitwise 的操作,對應上述程式最後一行也就是將 major
和 minor
合併成完整的設備號碼
最後可以使用以下命令查詢目前已被申請的設備號碼列表:
Linux 核心模組的符號 (symbol) 如何被 Linux 核心找到 (使用 List API)
首先在 linux/bsearch.h 可以看到這裡定義了一個 bsearch
的函式,其任務主要就是利用二分搜尋演算法查找到目標的 key
。
再來看到 find_exported_symbol_in_section
,首先要先利用 !fsa->gplok
判斷 fsa
和需要查找的 syms
是否有取得 GPL授權條款,再來會利用上述提到的 bsearch
查找符號。
最後在 kernel/module/main.c 中定義 Linux 核心如何找到符號的過程,其中如果沒在內建的模組找到則會利用 list_for_each_entry_rcu
逐步走訪每個已載入的核心模組並且使用 symsearch
定義相關資訊,這邊會分成兩個類型的符號表是因為會需要根據當前模組的許可證是否為符合 GPL 授權條款,如果是則需要查找 GPL 的符號表,另外還要使用 mod->state == MODULE_STATE_UNFORMED
判斷模組的狀態是否能在被設定中,若成立則代表此模組的符號表不可使用。
MODULE_LICENSE 巨集指定的授權條款又對核心有什麼影響 (GPL 與否對於可用的符號列表有關)
此巨集是定義模組的授權條款,若此模組是被授權的,則代表該模組可以使用為 GPL 的符號表,這是為了保護 GPL 軟體的自由,根據 GNU General Public License 的內容,藉由此授權可以保護對核心做出貢獻的程式設計師。
David A. Wheeler argues that the copyleft provided by the GPL was crucial to the success of Linux-based systems, giving the programmers who contributed to the kernel the assurance that their work would benefit the whole world and remain free, rather than being exploited by software companies that would not have to give anything back to the community.
藉由 strace 追蹤 Linux 核心的掛載,涉及哪些系統呼叫和子系統?
uname
:獲取系統的資訊,包括系統名稱、記憶體版本等等finit_module
:允許從文件系統中的位置直接讀取模組,和 init_module()
類似,但是它是從 file descriptor 中讀取要加載的模組內容init_module()
內容如下
init_module() loads an ELF image into kernel space, performs any necessary symbol relocations, initializes module parameters to values provided by the caller, and then runs the module's init function. This system call requires privilege.
其中 ELF 指的是一種文件格式,表示一個 executable binary file 或是 object file
記憶體管理系統呼叫
mmap
:用於在虛擬地址空間中創建一個新的映射給 process 使用,將一個文件映射進對應的記憶體空間
munmap
:用於取消記憶體映射
mprotect
:用來修改記憶體的保護狀態
文件系統操作
access
:檢查文件的訪問權限
openat
:打開文件
newfstatat
:獲取文件的狀態
read
:讀取文件內容
pread64
:從文件的指定 offset 位置開始讀取或寫入資料
brk
:調整 data segment 結尾的大小,data segment 通常是屬於存放已經有明確初始化的 global 和 static 變數
fcntl
:操作 file descriptor 屬性
lseek
:改變文件 offset
thread 控制系統相關
set_tid_address
:設置指向 thread ID 的指針
set_robust_list
:為 process 設置一個 robust 列表,用來儲存 thread 的資訊
prlimit64
:設置資源限制
閱讀《The Linux Kernel Module Programming Guide》(LKMPG) 並解釋 simrupt 程式碼裡頭的 mutex lock 的使用方式,並探討能否改寫為 lock-free
探討 Timsort, Pattern Defeating Quicksort (pdqsort) 及 Linux 核心 lib/sort.c 在排序過程中的平均比較次數,並提供對應的數學證明
研讀 CMWQ (Concurrency Managed Workqueue) 文件,對照 simrupt 專案的執行表現,留意到 worker-pools 類型可指定 "Bound" 來分配及限制特定 worker 執行於指定的 CPU,Linux 核心如何做到?CMWQ 關聯的 worker thread 又如何與 CPU 排程器互動?
解釋 xoroshiro128+
的原理 (對照〈Scrambled Linear Pseudorandom Number Generators〉論文),並利用 ksort 提供的 xoro
核心模組,比較 Linux 核心內建的 /dev/random
及 /dev/urandom
的速度,說明 xoroshiro128+
是否有速度的優勢?其弱點又是什麼?
解釋 ksort 如何運用 CMWQ 達到並行的排序