# 2024q1 Homework5 (assessment) contributed by < `yeh-sudo` > ## 改進測驗題 * [第 2 週測驗題 - 測驗 `1`](https://hackmd.io/godDgeeFQGGO1tWZtU9LSQ?view#%E6%B8%AC%E9%A9%97-11) * [第 2 週測驗題 - 測驗 `2`](https://hackmd.io/godDgeeFQGGO1tWZtU9LSQ?view#%E6%B8%AC%E9%A9%97-21) * [第 2 週測驗題 - 測驗 `3`](https://hackmd.io/godDgeeFQGGO1tWZtU9LSQ?view#%E6%B8%AC%E9%A9%97-3) ## 閱讀〈因為自動飲料機而延畢的那一年〉 > 「這個領域實在是太過廣博,現實如同真理般,給予和狂妄自負的傢伙相對應的絕望,對於沒有準備好的人毫不留情。我覺得自己像無頭蒼蠅一樣亂撞,做什麼都徒勞無功。」 在學習課程教材時,常常讓我有一種無力感,一方面是基礎不夠扎實,經過大學四年,我連最基本的 C 語言都沒有完全掌握,基本的語言特性與規格都沒有完全掌握了,更不用說編譯器的行為,如何最佳化等等議題,從第一週的指標與鏈結串列,到 bitwise 操作以及編譯器,每一個議題都可以再深深的往下挖,可以有許多延伸資料,有許多相關的議題可以討論,但時間總是不夠,看完一個錄影三個小時,就要花上可能一天來理解教材內容,教材內又還會延伸往另一個教材或是連結,怎麼學都學不完,看著教材內容發呆,想著我還要多久才能精通這些東西,讓自己寫出來的東西是可以被這個世界接受的,是安全、優美且可以重複被利用的,另外,看看別人寫的作業,跟我寫的作業,我努力絞盡腦汁想要做出自己想要的成果,或是想要用新的方法測試,但總是有同學可以想到更特別且合理的方法,觀摩同學的作業,也讓我體會到自身的不足,雖然很無力很累,但我開始學著注意細節,注意讓程式碼更安全,這堂課學的東西,可能比我之前每個學期學的還要多。 雖然現在才學期中,但我想學期末這門課結束時,是一個全新的開始,因為 Linux 核心每天都在變化,每天都有許多貢獻者貢獻程式碼,這堂課指引我們一個明確探討 Linux 核心與其他系統軟體的方向,這學期結束,我想是時間來好好複習計算機組織、作業系統與編譯器等等課程,到時候再回頭看這門課,一定會有不一樣的感受,搞不好能有機會貢獻程式碼到 Linux 核心。 ## 研讀課程教材 ### 並行程式設計 - 概念 #### Concurrency vs. Parallelism Concurrency 為程式架構,著重於拆分工作,以 Android 手機來說,運作時會有多個驅動程式,但彼此間都是獨立的,有時會互相合作,我們要去確保程式之間的執行順序。 Parallelism 著重規劃, 將能夠並行的程式,分配給不同硬體單元,可能是 CPU 或是 GPU ,使其同時執行。 ### Linux 核心設計: 淺談同步機制 #### 什麼時候需要進行同步? * 多個 CPU 要存取一個記憶體位置時 * 執行緒在 barrier 等待另外一個執行緒執行 * CPU 中斷處理,例如: IPI (Inter-Processor Interrupt) #### 作業系統提供的機制 ##### 1. Locks - [ ] Coarse-grained Lock 持有時間較長,並且可以延長持有時間,但運用 lock 本身較複雜,保護一個區域,要還原的代價較大。 - [ ] Fine-grained Lock 持有時間很短,不用鎖住整個區域,但資源管理代價較大。真實世界中往往在 coarse-grained 與 fine-grained 之間取捨。 ##### 2. Atomic Instructions 確保整個操作在不同處理器上, load 與 store 不會交錯。 > An atomic instruction guarantees that the entire operation is not interleaved with any other CPU. - [ ] Examples 1. Atomic increment/decrement 確保共享資源的執行順序不會交錯。 2. Compare and swap (CAS) ```c int compareAndSwap(int *loc, int expectedValue, int valueToStore) { ATOMIC { int val = *loc; if (val == expected) { *loc = valueToStore; } return val; } } ``` - [ ] [Lock-Free Programming](https://preshing.com/20120612/an-introduction-to-lock-free-programming/) 文章中用一張圖來定義 lock-free。 ![image](https://hackmd.io/_uploads/B1r1cawx0.png) 所以, lock-free 不一定是指有沒有使用 mutex ,而是指程式被某一種方法鎖定的可能性。 - [ ] Lock-Free Data Structure 在 CMU 的教材 [Lock-Free Programming](https://www.cs.cmu.edu/~410-s05/lectures/L31_LockFree.pdf) 討論 lock-free 的資料結構。 ##### 3. Atomic Instructions + Locks 1. Set counter to 1 2. Set the value to 0, go ahead 3. If get < 0, waiting 4. Increment and decrement counter are atomic operations. #### Waiting Strategies * Spinning: 在迴圈中不斷檢驗 atomic counter ,如果變為 1 ,則嘗試使用 atomic decrement 取得 lock 。 * Blocking: 沒有搶到 lock 就加入 wait-queue 然後休眠,等待有人 unlock 後才會被喚醒。 #### Linux Lock Strategies * Blocking: mutex, semaphore * Non-blocking: spinlocks, seqlocks, completions :::info > 在 Linux 核心中,起初僅有 semaphore 這個核心物件 (kernel object),直到 v2.6.16 核心才將 mutex 自 semaphore 實作中抽離。儘管 Mutex 與 Semaphore 兩者都是休眠鎖,但 Linux 核心實作 mutex 時,運用加速技巧,將上鎖區分以下三個步驟: > > Fast path: 嘗試使用 atomic operation,減少 counter 數值來獲得鎖。 Mid path: 上一步若失敗,嘗試使用特化的 MCS spinlock 等待,再取鎖。當持鎖的 thread 還在執行,且系統不存在更高優先權的任務時,即可推定,持鎖的 thread 很快就會把鎖釋放出來,因此會使用一個特化的 MCS spinlock 等待鎖被釋放。特化的 MCS spinlock 可在被重新排程時,退出 MCS spinlock queue。當走到這步時,就會到 Slow path。 Slow path: 鎖沒有辦法取得,只好把自己休眠。走到這一步,mutex 才會將自己加入 wait-queue 然後休眠,等待有人 unlock 後才會被喚醒。 這段描述在 Linux 核心中 mutex 的實作方法,其中 wait-queue 與 spinlock 都有用到,這樣還算是 blocking 的 lock 嗎? ::: ## 簡述想投入的專案 ### [高效網頁伺服器](https://hackmd.io/@sysprog/linux2023-projects#%E9%AB%98%E6%95%88%E7%B6%B2%E9%A0%81%E4%BC%BA%E6%9C%8D%E5%99%A8) 在修這堂課之前,我有自學後端與一點網頁設計,但在都端的學習上,都是用別人現成的框架例如 Fastapi 或是 Flask 等,這些框架都是在網頁伺服器上執行,像 Fastapi 是在 Uvicorn 上執行的,我想透過這個專案,完成一個網頁伺服器,或是修改現有的專案,以便於之後再這個網頁伺服器上開發自己的開源後端框架,並學習並行程式設計等相關議題。 ### [simplefs](https://hackmd.io/@sysprog/linux2023-projects#simplefs) 我自己實習的公司是生產 NAS 與各種儲存裝置的,而 NAS 中運作的作業系統就是 Linux ,公司也積極尋求 [Linux 核心的開發者](https://career.synology.com/zh-tw/HQ/position/154),透過這個專案,可以了解檔案系統的運作原理,並且透過這個專案找到工作。 ### [改進 Linux 核心的 lib/{list_}sort.c](https://hackmd.io/@sysprog/linux2023-projects#%E6%94%B9%E9%80%B2-Linux-%E6%A0%B8%E5%BF%83%E7%9A%84-liblist_sortc) 因為在 lab0-c 與第一次測驗中,都有提及排序演算法,我覺得我當時的作業都還有延伸的空間,以及尋求改進 Linux 核心中排序演算法的機會。 --- pthread_rwlock_rdlock RAID fs, fs cache, dentry, database sysfs, procfs, ... Flash, SSD, block-based storage medium spinlock (unsleepable) vs. mutex (sleepable) 差異 (教科書) spinlock: IRQ (interrupt request), fs (i-node), seqlock TODO: https://github.com/sysprog21/cserv [第 8 週](https://hackmd.io/@sysprog/linux2024-quiz8), [第 9 週測驗題](https://hackmd.io/@sysprog/linux2024-quiz9) [並行程式設計: Atomics 操作](https://hackmd.io/@sysprog/concurrency-atomics) [從 CPU cache coherence 談 Linux spinlock 可擴展能力議題](https://hackmd.io/@sysprog/linux-spinlock-scalability) [並行程式設計: 排程器原理](https://hackmd.io/@sysprog/concurrency-sched): M:N threading model [並行程式設計: 建立相容於 POSIX Thread 的實作](https://hackmd.io/@sysprog/concurrency-thread-package)