--- GA: UA-34467841-15 --- # Prometheus + AutoML 驅動的 AIOps 革命 - 蕭兆洋(Charles Hsiao) ###### tags: `HelloWorld2025` `HWDC2025` `2025` `605+606 會議室` `AI 如何驅動 DevOps 革命` <blockquote> 在現代雲端基礎設施管理中,我們經常面臨維運的三大痛點:反應式監控(問題發生後才發現)、數據孤島(各種 metrics 缺乏關聯分析)、人工判斷依賴(需要資深工程師經驗才能識別異常模式)。 想像一下,如果你的可觀測性平台能夠像資深 SRE 一樣,不僅能夠即時洞察系統狀態,還能預測未來的潛在問題,甚至自動關聯不同維度的指標異常,這將如何革命性地改變我們的維運方式? 本次演講將深入探討如何運用 PyCaret AutoML 技術,充分釋放 Prometheus metrics 在可觀測性領域的巨大潛能。涵蓋以下核心技術要素: - 深度挖掘 Prometheus metrics 的預測價值:  剖析四大 Prometheus metrics 類型在不同維運場景的應用策略建立多指標關聯分析機制,將單一指標分析升級為系統性健康評估 - AutoML 驅動的智能預測與異常檢測 運用 AutoML 技術選擇最適合的機器學習算法,建立時間序列預測、異常檢測、回歸分析的模型選擇決策框架實現週期性指標變化預測、即時系統異常識別、資源瓶頸時間點精準預測 - 智能化維運決策與自動化整合 結合 LLM 技術將複雜的機器學習預測結果轉化為可執行的維運建議與洞察報告建立預測結果與雲端平台自動化資源調度、故障自癒機制的無縫整合 讓我們一起從傳統的被動監控模式,邁向真正的主動預測維運,實現 AIOps 的核心價值! 聽眾收穫: - AIOps: 掌握 PyCaret AutoML 實戰應用技巧建立四大 Prometheus metrics 類型對應的機器模型選擇決策框架學會運用外生變數和多維度特徵工程提升預測模型準確性理解機器學習模型如何處理缺失值與異常點的穩健性 - 智能運維轉型思維: 掌握將機器學習預測結果轉化為雲端平台自動化資源調度的實施策略學會運用 LLM 技術生成人類可理解的運維洞察和決策建議理解從傳統被動監控向主動預測運維模式的轉換路徑和關鍵要素 - 實戰應用與組織價值: 獲得可立即複製的 AIOps 實施方法論和最佳實踐案例掌握團隊 AIOps 能力建設的評估指標和推動策略學會設計故障自癒系統的核心原則和風險控制機制 </blockquote> {%hackmd @HWDC/announcement-2025 %} ## 會議資訊 **時間:** 14:20 ~ 15:05 **地點:** 605+606 會議室 **日期:** 2025年10月14日 **語言:** 中文 **難度:** 中階 **相關連結:** - [Hello World Dev Conference 2025 官方網站](https://hwdc.ithome.com.tw/2025) [target=_blank] - [Hello World 2025 議程表](https://hwdc.ithome.com.tw/2025/agenda) [target=_blank] ## 筆記區 > 請從這裡開始記錄你的筆記 ## 討論區 > 歡迎在此進行討論與 Q&A ## 相關資源 - 投影片連結:https://www.scribd.com/document/932350585/Hello-World-Dev-Conf-2025-Prometheus-AutoML-%E9%A9%85%E5%8B%95%E7%9A%84-AIOps-%E9%9D%A9%E5%91%BD - 相關文件:(待更新)