# 在設備跟雲的融合之路上孵化 SRE 的旅程 - 吳俊德 (Julian) ###### tags: `2023` {%hackmd @sre-conf/H1pCafrG3 %} ## 服務的複雜度:低 進版頻率:低 預估資源:容易 -> 瀑布式開發 市場期待的更新速度:快 系統穩定度收斂速度:慢 資源預估:難 ->敏捷式開發 > 開發方式改變:約莫以2010為分水嶺 |瀑布式開發|敏捷式開發| |:---:|:---:| 複雜度低 | 更新速度快 進版頻率更低 | 系統穩定收斂速度慢 預估資源容易 | 難以預估資源 ## 硬體跟雲端的天人交戰 #### 硬體 - 韌體很難天天改版 - 單一硬體沒有 scalability issue - 防火牆讓你的設備不易被發現 - 不太有個資議題 #### 雲端 - 雲端整天進版好像是天經地義 (會被要求要系統更新速度) - 雲內算力隨取就有(?) 會標失敗 :( - 駭客知道廠商有哪些雲服務 - 收資料出報表難逃個資議題 ## ZNET SRE - 7 人 - RD 或 IT 背景 - 網通相關知識 - 熟悉 Software Engineering - Sustain engineer lead 經驗 > 消防隊員 - 產品 PM 經驗 ## 先講結論:文化很重要 - 敏捷(開發) - Agile Team 包含 PM、RD(FW & Cloud)、QA 跟 SRE - 合作跟溝通 - 降低整體(Ent-to-End)的複雜度,盡量做 Parameterization - 架構出合理的守備範圍(e.g. 雲/設備、測試/研發、資安 etc) - Business Impact Assessment (e.g. Downtime) - 自動化 - 程式的部署:parameters的部署(implement a generator) - 異常的事件通知U - 監控 - SLO metrics, **Outage** - Business Insight ## 全球化下 SRE 的挑戰 - 24 x 7 - 停機維護是奢侈要求(EX. 歐洲客戶週末施工) - 歐洲人週五下午下班前趕進度,美東與台灣時差 12 小時 - GDPR - Pseudonymization必備;SRE在檢查資料是否破損時不能有個資洩漏風險。 - 資安 - Fix 要即時 ## #1 開發:先有硬(韌)體還是先有雲 - 過去習慣先做好硬體,再來找雲作加值 - 硬體沒先準備好控制介面跟資料,能加值的有限 - 硬體的算力遠小於雲,沒有先談架構分工,很多功能無法實現 - 韌體工程師若不熟悉 internet 的特性或 CAP 定理,維運成本會變高 - 基於不同晶片商做出來的韌體有不同的邏輯導致 DB schema .....(求幫補 - Dev:開發初期一起討論時,SRE協助 - 預估所需資源 - 提出過去類似設計 - scale out / concurrnecy參數 - 例外處理的成本預估 - Prod:上線後SRE的日常生活 - Usage 成長率(CPU、Memory) - DP/API的Loading Latency - HTTP 5XX 的監控 ## #2 當資安通報進來 1. 確認通報問題會是哪個點(Server, Application, Infra)是否真的出問題 - 不同的 Protocol 不會住在同一個 Server ,因為難釐清誰害到誰 - AWS Infra 上 - Application的問題通常都是 Developer coding 的問題(i.e. XSS) 2. 有些狀況SRE可以快速解決 - 使用NGINX擋掉application framework沒有正常處理的http header 3. 若須 developer 協助,SRE 聯絡 developer 跟 manager 確認問題是否緊急 - 在緊急狀況下,當dveloper 進行hotfix ## #3 專案支援 > SRE是發生事情的時候會被考古的人 ## #4 Tools AWS Cloud Watch, Prometheus --- === 聊天室 === SRE = Systemctl Restart Engineer🤣 ``` Failed to restart Engineer.service: Unit Engineer.service not found. ``` -> 😂有才 ~~試問詮釋SRE的一百種解釋~~ SEE READ END SHOW RUNNING EVENT 可是薪水不一樣啊 好亮 ->好亮 請教大家一個問題,大家都用「部署」還是「部屬」? -> 部署吧?有部屬這個用法嗎 -> 部屬不是指人嗎? -> 部署+1 ->  -> 應該是部屬會去部署 -> 那布署跟佈署呢?XD > 有 SOP 看 SOP ,沒SOP 找 SRE
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up