# 91APP Way: 91APP 在 AWS 上的 SRE 實踐之路 ## 司方向:自己開發(Feature Teams),自己維運(AP Team) SRE要關注的(用軟體工程來解決問題): 1.異常處理 2.SLO:監控機制、系統架構 3.軟體工程:人管系統、系統管服務 SRE原則: 1.轉注在溝通流程、API介面 2.盡可能使用Managed Services 3.具體的規範與流程,系統架構透明化 實際怎麼做? 1.事件處理與管理流程 標準化 2.使用高可靠的監控系統 3.提高運行平台的可靠度 4.降低系統架構複雜度 5.標準化、規範化 ![123](https://i.imgur.com/sIV2Rwg.jpg "123") 公司規模 001~100: SRE Team規模 1-3 [監控、事件管理] 100~200: SRE Team規模 1-5 [系統可靠度、事件管理] 200~300: SRE Team規模 3-10 [降低系統複雜度、DR、Cost、標準化] 300~ : SRE Team規模 5-15 [API、平台化、規模化]