SRE 讀書會 Round 4 #03 - 線上讀書會共筆

###### tags: `Linux`, `SRE` # SRE 讀書會 Round 4 #03 - 線上讀書會共筆 ## 活動資訊 * Date: 2020/05/21 (四) 20:00 - 21:30 * [導讀進度表](https://docs.google.com/spreadsheets/d/1Lgti3mILkvwxyzklX1vvLraaGD-7ePK9rkmlulfOknE/edit#gid=0) * [導讀 Guideline](https://study-area.sre.tw/GuideLine/) * Github: [study-area-docs](https://github.com/cross-community/study-area-docs) --- ## 現場共筆 ### 軟中斷 ### 硬中斷現在有些設計反其道而行，就是一直再那邊看外送員有沒有來，用 CPU換效能 Intel 有些 CPU數量很多所以會使用這種方式 Polling > [Data Plane Development Kit, DPDK](https://zh.wikipedia.org/zh-tw/DPDK) 1. top half => 快速執行 Critical effect ,在執行的時候不能進入睡眠,可以lock (spin lock) 2. button half => 延遲執行可以晚點再做, 可以匯入 queue 中的 3. hardware interrupt =>由硬體做源頭 4. software interrupt =>由軟體(user)做源頭 (指標找不到, 1/0 等 ) ## 問題討論 Q: 為什麼要有殭屍程序? > * 殭屍程序對應用程式來說，可能是有意義的 > * [why zombie process necessary](https://stackoverflow.com/questions/16416793/why-is-a-zombie-process-necessary) Q: 殭屍程序有可能復活？ > 不知道是誰在管理的所以沒辦法復活 Q: 為什麼 OS 不自動把殭屍程序處理掉？ - 經驗分享: 有服務需要每個小時重開一次 Q: 一台長期不容易安排重開機的 application client node, 記憶體仍剩下數百G, swappiness 設置=1, 但有部分系統程序例如 systemd, rsyslogd, …等.. 吃到SWAP, 例如加總一半的空間, 執行 swapoff , swapon 存在崩潰的風險, 除了不理他並安排重新啟動, 有沒有更好的方法? Q: 作者好像對於軟中斷類型的介紹很簡單帶過，上網查說軟中斷又有tasklet, workqueue等等類型，看到有點混淆，不知道有沒有對這方面熟悉的大大可以幫忙解惑一下這部分？ > 中斷打進來，上半部：快速執行(不允許睡眠，可以busy lock/spin lock)、下半部：延遲執行 > workqueue 針對IO --- # 參考資料 * [why zombie process necessary](https://stackoverflow.com/questions/16416793/why-is-a-zombie-process-necessary)