系統軟體開發思維

「如果你把游泳池當作浴缸泡著，再泡幾年還是不會游泳」 – jserv

Maslow's pyramid of code review

Image Not Showing Possible Reasons

The image file may be corrupted
The server hosting the image is unavailable
The image path is incorrect
The image format is not supported

Learn More →

21 世紀的軟體開發均已規模化，絕非「有就好」，而是持續演化和重構，code review 是免不了的訓練
Charles-Axel Dein (GensDeConfiance 公司的工程副總、前 Uber 軟體開發經理) 認為好的程式碼應該要:
- [ Correct ] : 做到預期的行為了嗎？能夠處理各式邊際狀況嗎？即便其他人修改程式碼後，主體的行為仍符合預期嗎？
- [ Secure ] : 面對各式輸入條件或攻擊，程式仍可正確運作嗎？
- [ Readable ] : 程式碼易於理解和維護嗎？
- [ Elegant ] : 程式碼夠「美」嗎？可以簡潔又清晰地解決問題嗎？
- [ Altruist ] : 除了滿足現有的狀況，軟體在日後能夠重用嗎？甚至能夠抽離一部分元件，給其他專案使用嗎？
「需求」層次: 正確 → 安全 → 可讀 → 優雅 → 利他

「事實」很容易被遮蔽，所以我們要 Benchmark / Profiling

Image Not Showing Possible Reasons

The image file may be corrupted
The server hosting the image is unavailable
The image path is incorrect
The image format is not supported

Learn More →

source: twitter

運算模式的巨變

[ source ]

早年計算能力相對低的年代，常常有用查表法代替計算，有空間換取時間的做法，來增進效能。… 那個時候個人電腦的 CPU 可以在一個時脈週期中讀取一筆資料，但是要做乘法計算則需要幾十個時脈週期，所以用查表的比較快。除法和超越函數更是如此，而現在還有一些低階的處理器，還在用這些技巧。
後來當 CPU 時脈提高，但記憶體存取相對變慢的時候，我們必須反過來減少記憶體存取的次數，所以高階處理器 cache 越來越大，做 data prefetch 來提早取得資料、使用 multi-threaded architecture 來容忍資料遲到的狀況、使用壓縮的方式傳送資料，甚至還會用 speculation 的方式來猜測資料是在哪裡和是什麼。
在多處理機和多核心電腦上，存取資料的問題更嚴重，除了時間延遲和頻寬之外，還要考慮到尖峰時刻塞車的問題，所以有時候簡單的工作，就可能就不分工了，要不就由一個 CPU 代表去做，做完把結果給大家，要不就大家都做同樣的事情。前者多半在有共享記憶體的多核心處理器上看到，後者多半在分散式的系統看到。
到了異質計算的年代，CPU 和 GPU 的分工，更需要好好地做效能分析。因為傳統 GPU 和 CPU 不共享記憶體，透過較慢的 PCIe Bus 交換資料，所以有些工作 CPU 自己做比較快。另一方面，當 GPU 有超過 2000 個核心的時候，用重複的計算 (redundant computation)取代資料交換，也是常見的事。
更進一步談巨量資料，為了節省資料的取得時間，我們往往費盡心思。我們花時間將資料和計算擺在同一個地方，做所謂的 data computation co-location，將重複出現的資料利用 data deduplication 技術節省儲存空間和取得時間，用一堆目錄 (indexing) 讓資料可以快速被找到。
當計算機結構有所不同時，優化的策略可能會隨之而變，不能食古不化。但原理雖然簡單，系統和實作技巧卻越來越複雜，軟硬體優化的機會越來越多，可惜能夠真正連通理論和實務的人則越來越少。
以上這些技術，講起來很容易，但在實作上，必須先搞清楚運算和資料的相對位置、距離、時間先後、相依性、數量等等，才知道該如何取捨。但很多人根本不會用效能分析工具，就在那邊瞎子摸象，隨便亂講，這時候要解決問題，就需要瞎貓遇到死耗子的運氣。
i586 和 i686 看起來指令相似，但本質不同！
- 從 i686 (Pentium Pro) 開始，底層已經是 RISC 架構
因為現在計算機結構改變很大，即便把程式用組合語言重寫，效能也不見得比編譯器產生的還好
- 效能的問題在存取資料本身
- 組合語言會快，是因為你分析過程式要怎樣寫才可以比較快
- 直接照著程式碼的邏輯改寫組合語言不見得比較好
Bloom Filter
- 處理大型資料的時候，往往需要一個索引可以快速的找到資料．這樣的索引就被稱為 filter
- 判斷特定的數值是否存在，簡單的方式就是每一個都找過一次，這樣下去的時間複雜度就是
  $O (n)$ 。也有一個比較快的方式就是將所有的數值變成一個陣列，然後該數字存在就將其紀錄為 1 的 (Mapping Table) 方式，這樣的時間複雜度就會是
  $O (1)$ ，但是空間複雜度就會變成 n
- 是否存在一種資料結構能夠兼具
  $O (1)$ 的時間複雜度，但是又不需要有
  $n$ 的空間複雜度的 Filter 呢？
- Bloom Filter 是個提供
  $O (1)$ 搜尋時間複雜度的手法
- Bloom filter calculator
hyperloglog
- 使用 1.5k 表達 10 億筆資料
- Python implementation of Hyperloglog, redis, fuzzy hashing for malware detection

系統軟體開發思維

Maslow's pyramid of code review

「事實」很容易被遮蔽，所以我們要 Benchmark / Profiling

運算模式的巨變

Read more

你所不知道的 C 語言：數值系統

建構 User-Mode Linux 的實驗環境

Linux 核心設計: Scheduler(8): Energy Aware Scheduling

你所不知道的 C 語言: linked list 和非連續記憶體