系統軟體開發思維

# 系統軟體開發思維 :::success 「如果你把游泳池當作浴缸泡著，再泡幾年還是不會游泳」 -- jserv ::: ## [Maslow's pyramid of code review](http://www.dein.fr/2015-02-18-maslows-pyramid-of-code-review.html) ![](https://i.imgur.com/DBMmMNi.png) * 21 世紀的軟體開發均已規模化，絕非「有就好」，而是持續演化和重構，code review 是免不了的訓練 * Charles-Axel Dein (GensDeConfiance 公司的工程副總、前 Uber 軟體開發經理) 認為好的程式碼應該要: * [ Correct ] : 做到預期的行為了嗎？能夠處理各式邊際狀況嗎？即便其他人修改程式碼後，主體的行為仍符合預期嗎？ * [ Secure ] : 面對各式輸入條件或攻擊，程式仍可正確運作嗎？ * [ Readable ] : 程式碼易於理解和維護嗎？ * [ Elegant ] : 程式碼夠「美」嗎？可以簡潔又清晰地解決問題嗎？ * [ Altruist ] : 除了滿足現有的狀況，軟體在日後能夠重用嗎？甚至能夠抽離一部分元件，給其他專案使用嗎？ * 「需求」層次: 正確 → 安全 → 可讀 → 優雅 → 利他延伸閱讀: [Code Reading](https://en.wikipedia.org/wiki/Code_Reading) * 大量篇幅回顧 C 語言概念，以及在真實世界中的程式如何展現，細節！ ## 「事實」很容易被遮蔽，所以我們要 Benchmark / Profiling ![](https://hackpad-attachments.s3.amazonaws.com/embedded2015.hackpad.com_xDmCCv0k00K_p.299401_1446124062219_truth.jpg) source: [twitter](https://twitter.com/Harvey1966/status/624099087466500096) ## 運算模式的巨變 [ [source](https://www.facebook.com/shihhaohung/posts/995419510500537) ] * 早年計算能力相對低的年代，常常有用查表法代替計算，有空間換取時間的做法，來增進效能。... 那個時候個人電腦的 CPU 可以在一個時脈週期中讀取一筆資料，但是要做乘法計算則需要幾十個時脈週期，所以用查表的比較快。除法和超越函數更是如此，而現在還有一些低階的處理器，還在用這些技巧。 * 後來當 CPU 時脈提高，但記憶體存取相對變慢的時候，我們必須反過來減少記憶體存取的次數，所以高階處理器 cache 越來越大，做 data prefetch 來提早取得資料、使用 multi-threaded architecture 來容忍資料遲到的狀況、使用壓縮的方式傳送資料，甚至還會用 speculation 的方式來猜測資料是在哪裡和是什麼。 * 在多處理機和多核心電腦上，存取資料的問題更嚴重，除了時間延遲和頻寬之外，還要考慮到尖峰時刻塞車的問題，所以有時候簡單的工作，就可能就不分工了，要不就由一個 CPU 代表去做，做完把結果給大家，要不就大家都做同樣的事情。前者多半在有共享記憶體的多核心處理器上看到，後者多半在分散式的系統看到。 * 到了異質計算的年代，CPU 和 GPU 的分工，更需要好好地做效能分析。因為傳統 GPU 和 CPU 不共享記憶體，透過較慢的 PCIe Bus 交換資料，所以有些工作 CPU 自己做比較快。另一方面，當 GPU 有超過 2000 個核心的時候，用重複的計算 (redundant computation)取代資料交換，也是常見的事。 * 更進一步談巨量資料，為了節省資料的取得時間，我們往往費盡心思。我們花時間將資料和計算擺在同一個地方，做所謂的 data computation co-location，將重複出現的資料利用 data deduplication 技術節省儲存空間和取得時間，用一堆目錄 (indexing) 讓資料可以快速被找到。 * 當計算機結構有所不同時，優化的策略可能會隨之而變，不能食古不化。但原理雖然簡單，系統和實作技巧卻越來越複雜，軟硬體優化的機會越來越多，可惜能夠真正連通理論和實務的人則越來越少。 * 以上這些技術，講起來很容易，但在實作上，必須先搞清楚運算和資料的相對位置、距離、時間先後、相依性、數量等等，才知道該如何取捨。但很多人根本不會用效能分析工具，就在那邊瞎子摸象，隨便亂講，這時候要解決問題，就需要瞎貓遇到死耗子的運氣。 * i586 和 i686 看起來指令相似，但本質不同！ - 從 i686 (Pentium Pro) 開始，底層已經是 RISC 架構 * 因為現在計算機結構改變很大，即便把程式用組合語言重寫，效能也不見得比編譯器產生的還好 - 效能的問題在存取資料本身 - 組合語言會快，是因為你分析過程式要怎樣寫才可以比較快 - 直接照著程式碼的邏輯改寫組合語言不見得比較好 * [Bloom Filter](http://www.evanlin.com/BloomFilter/) * 處理大型資料的時候，往往需要一個索引可以快速的找到資料．這樣的索引就被稱為 filter * 判斷特定的數值是否存在，簡單的方式就是每一個都找過一次，這樣下去的時間複雜度就是 $O(n)$。也有一個比較快的方式就是將所有的數值變成一個陣列，然後該數字存在就將其紀錄為 `1` 的 (Mapping Table) 方式，這樣的時間複雜度就會是 $O(1)$，但是空間複雜度就會變成 `n` * 是否存在一種資料結構能夠兼具 $O(1)$ 的時間複雜度，但是又不需要有 $n$ 的空間複雜度的 Filter 呢？ * Bloom Filter 是個提供 $O(1)$ 搜尋時間複雜度的手法 * [Bloom filter calculator](https://hur.st/bloomfilter) * [hyperloglog](https://en.wikipedia.org/wiki/HyperLogLog) - 使用 1.5k 表達 10 億筆資料 - [Python implementation of Hyperloglog, redis, fuzzy hashing for malware detection](https://bigsnarf.wordpress.com/2013/03/16/python-implementation-of-hyperloglog-redis-fuzzy-hashing-for-malware-detection/)