OTel 電商系統 --- ![image](https://hackmd.io/_uploads/rJKrW8K0kg.png) # 業務 SLI ## 電商產業常見指標 ``` graph TD A[電商產業數據指標體系] --> B[整體營運指標] A --> C[流量規模] A --> D[銷售轉換指標] A --> E[顧客價值指標] A --> F[商品類指標] A --> G[行銷活動指標] A --> H[風險控管指標] A --> I[市場競爭指標] B --> B1[流量規模:網站或App的總訪問量,反映品牌整體曝光度] B --> B2[訂單數量:一定期間內產生的訂單總數,是營運績效的重要指標] B --> B3[成交金額GMV:所有成功交易的總金額,常用於評估銷售規模] B --> B4[客單價AOV:每筆訂單的平均消費金額,有助於分析顧客消費能力] C --> C1[獨立訪客數UV:一定期間內,獨立訪問網站的用戶數,反映網站吸引新客的能力] C --> C2[頁面瀏覽量PV:所有用戶瀏覽網頁的總次數,越高代表用戶黏著度越好] C --> C3[訪問深度:平均每位用戶瀏覽的頁數,代表用戶對內容的興趣程度] C --> C4[跳出率:進入網站後僅瀏覽一頁就離開的用戶比例,過高可能代表內容不吸引人] D --> D1[加入購物車率:訪客中有多少比例將商品加入購物車,是購買意願的前期指標] D --> D2[下單轉換率:訪客中有多少比例完成下單,是衡量網站銷售力的核心指標] D --> D3[付款成功率:下單後實際完成付款的比例,反映支付流程是否順利] D --> D4[購物車放棄率:將商品加入購物車但未結帳的比例,過高可能需優化結帳流程] E --> E1[新客獲取成本CAC:平均每取得一位新客戶所需的行銷成本] E --> E2[顧客終身價值LTV:預計一位顧客在整個關係期間會為企業帶來的總收入] E --> E3[顧客留存率:某段期間內,持續回購的顧客比例,越高表示顧客忠誠度佳] E --> E4[RFM模型:根據顧客最近消費時間Recency、消費頻率Frequency、消費金額Monetary評估顧客價值] F --> F1[SKU數量:網站上架商品的品項數量,SKU代表單一商品規格] F --> F2[庫存週轉率:一段時間內庫存被售出的次數,反映庫存管理效率] F --> F3[熱銷商品分析:找出最暢銷的商品,作為行銷與補貨依據] F --> F4[商品連帶率:顧客一次購買多件商品的比例,反映交叉銷售成效] G --> G1[廣告投資報酬率ROI:廣告帶來的營收與花費的比值,用來評估廣告效益] G --> G2[活動參與率:參與促銷活動的用戶比例,反映活動吸引力] G --> G3[優惠券使用率:發放的優惠券被實際使用的比例,評估促銷效果] G --> G4[活動成效監控:綜合追蹤各行銷活動的轉換、營收等成效] H --> H1[詐騙訂單率:偵測到疑似詐騙的訂單比例,是防詐系統的重要指標] H --> H2[退貨率:已完成訂單中被退貨的比例,過高需檢討商品或服務品質] H --> H3[客訴率:收到顧客投訴的比例,反映客服與商品問題] H --> H4[負評分析:顧客負面評論的內容與比例,協助改善產品與服務] I --> I1[市場佔有率:自家在整個市場中的銷售比例,常用於評估競爭地位] I --> I2[競品價格比較:自家商品與主要競品的價格差異,有助於訂定定價策略] I --> I3[品牌搜尋指數:用戶在搜尋引擎上主動搜尋品牌的頻率,衡量品牌知名度] I --> I4[通路覆蓋率:商品上架於各銷售通路的比例,代表市場滲透程度] ``` 應該先定義業務目標:先明確“為何”要可觀測(如提升某業務流程可靠性),再決定“監控什麼”。 再來聚焦關鍵業務流程:以 SLO /SLI 為核心,追蹤影響用戶體驗和業務結果的端到端流程,而非僅僅監控單一服務。 目的: - 可靠性保證︰讓關鍵業務流程高可用、低延遲、不出錯,直接影響客戶體驗與收入。 - 成本與效率優化︰避免無效資料蒐集、降低雲資源消耗、減少維運人力成本,提升 ROI。 - 主動預防與快速修復︰透過 AI、Tracing、SLO 等手段,及早發現並解決問題,減少故障對業務的衝擊。 - 決策支持與創新推動︰讓業務、產品、技術團隊能根據觀測數據做出更快、更有信心的決策,推動新功能、優化用戶體驗。 - 證明可觀測性投資的價值︰讓大家能看到,每一筆可觀測性支出,都有效提升了客戶滿意度、業務成長或營運效率,而不是單純的技術成本。 $$ 指標優先級別 = \dfrac{業務影響程度*故障敏感度}{複雜度} $$ 業務影響程度︰該指標對業務影響大小,如營收、使用者滿意程度。 故障敏感度指該指標對系統故障的敏感程度,即出現問題時指標的變化是否明顯。 - 流量規模指標 - 網站載入與顯示時間每增加2秒,使用者跳失率增加103% - 系統健康指標 - 支付Payment服務 SLO - SLI : 成功支付請求數量 / 總支付請求數量 - SLO 月度目標 99.5% - 錯誤預算 0.5% -> 一個月允許失敗約21分鐘 - 降級條件 可以設定成連續 5 分鐘 < 98% 成功率則觸發 alert - 訂單Checkout延遲 SLO - SLI : order process duration second - 相關服務 - 讀取購物車 目標p99 < 1s - 支付處理 目標 p99 < 2s - 匯率Currency 服務可用性 SLO - 推薦 Recommendation 系統回應時間 SLO - 轉換漏斗指標 - 訂單履約追蹤 - 支付體驗不好,也會導致轉換率下降。研究顯示每延遲100ms,轉換率下降7%。 - 風控事件 - 欺詐訂單標記 - 異常支付模式 [Akamai Online Retail Performance Report: Milliseconds Are Critical](https://www.akamai.com/newsroom/press-release/akamai-releases-spring-2017-state-of-online-retail-performance-report)