--- GA: UA-34467841-15 --- # 從資源浪費到節能自治:讓你的 K8s 不再像開著 N 個分頁的瀏覽器 - 蔡宗城 (smalltown) ###### tags: `KubeSummit2025` `K8s2025` `2025` `kubernetes` `ABC 會議室` `AIOps` `FinOps & K8s` `K8s 優化` <blockquote> 當我們將服務搬上 Kubernetes,挑戰從「能跑」變成「跑得好」,而現在又多了一個挑戰:「跑得省」。 在這場分享中,我們將以 GreenPod 為主軸,探討目前在 Kubernetes 生態中,如何用實際可落地的工具(如 kube-green、Descheduler)打造節能導向的資源調度策略,並搭配我們對 Smart HPA 的探索與實驗想法,展示未來可能的智能擴縮架構。內容將涵蓋: 傳統 HPA 在實務上的限制與踩坑案例GreenPod 的核心概念與落地工具介紹:kube-green、Descheduler...等如何設計節能調度模式並導入至真實叢集Smart HPA 是什麼?有什麼是目前可以嘗試的?有什麼坑是必須避開的?綠能擴縮」背後的價值不只是省錢,而是工程團隊的新挑戰與成就感 《聽眾收穫》 學會使用 kube-green 與 Descheduler 打造節能 Kubernetes 調度策略理解在真實叢集導入 GreenPod 思維的設計與實作挑戰知道 Smart HPA 的發展現況與實驗方向,避免走冤枉路重新思考「資源調度」不只是為了能跑、更是為了跑得有良心、有智慧 </blockquote> {%hackmd @k8ssummit/announcement-2025 %} ## 會議資訊 **時間:** 16:00 ~ 16:40 **地點:** ABC 會議室 **日期:** 2025年10月22日 **語言:** 中文 **難度:** 中階 **相關連結:** - [KubeSummit 2025 官方網站](https://k8s.ithome.com.tw/2025) [target=_blank] - [KubeSummit 2025 議程表](https://k8s.ithome.com.tw/2025/agenda) [target=_blank] ## 筆記區 ### 從資源浪費到節能自治:讓你的 K8s 不再像開著 N 個分頁的瀏覽器 **講者:Tom Tsai(MaiCoin Group / Infrastructure Director)** --- ### 🎬 開場:那個永遠不敢關的分頁 * K8s 就像瀏覽器,一開就是 N 個分頁,誰也不敢關。 * 我們都知道要「自動化」,卻忘了要「節能化」。 * 今天的主題不是省錢,而是**讓叢集變成一個有意識的公民**。 > 💡 「叢集的永續,不是成本問題,是文化問題。」 --- ### 🧩 背景與動機(Why) #### 雲帳單讓人懷疑人生 * 每月結帳時,EKS / RDS / S3 金額一路飆。 * Grafana 上指標都健康,唯一不健康的是財務長。 * FinOps 是被動補洞,GreenOps 才是主動治本。 #### 自動化 ≠ 聰明化 * 自動化沒錯,但方向錯了就是高效率浪費。 * 「讓帳單金額自動化上升」是很多團隊的真實寫照。 #### 從能跑到要跑得省 * FinOps 解決財務壓力;GreenOps 解決良心壓力。 * 省錢是 KPI,節能是責任。 * 「救地球,從節省一個 Pod 開始。」 --- ### ⚙️ 現況與衝突(What’s broken) #### HPA 沒有反應真實需求 * 看 CPU 很準,看使用者很鈍。 * HPA:「我很好,你們先忙。」 #### 離峰節點還在加班 * 晚上沒流量,節點仍亮整晚。 * 「它不是敬業,是沒人教它下班。」 #### 不同工作負載互搶資源 * 白天跑 API,晚上跑夢想(ETL)。 * Scheduler:我只是想下班。 #### 自動化沒有解決浪費 * 「自動化的浪費,只是更快的浪費。」 * 問題在文化:沒人敢砍、不知道該砍誰。 --- ### 🌱 大創意:GreenPod 叢集自治藍圖 #### 叢集也能有公民意識 * Pod 是居民、Node 是建築、Scheduler 是市政中心。 * 每個 Pod 都該守法(ResourceQuota、LimitRange)。 #### GreenPod 的三個核心價值 1. **自律**:叢集知道何時該休息。 2. **透明**:可觀測、可審計、可回滾。 3. **永續**:效率與責任並行。 #### 「從命令到共識」 * 技術成熟後,挑戰來自文化。 * 「以前靠 kubectl,現在靠 EQ。」 --- ### 🌙 kube-green:讓叢集會睡覺 #### 基本理念 * CronJob 控制 Pod 睡眠與喚醒,讓叢集離峰自動休息。 * 「K8s 也需要良好的睡眠品質。」 #### 設定範例 ```yaml apiVersion: kube-green.com/v1alpha1 kind: SleepInfo spec: weekdays: ["Monday","Tuesday","Wednesday","Thursday","Friday"] sleepAt: "22:00" wakeUpAt: "07:00" ``` > 「這段 YAML 讓叢集比工程師還準時上下班。」 #### 導入挑戰 * 應用依賴、喚醒延遲、排程衝突。 * 「要讓 Pod 睡著,比哄小孩簡單。」 #### 最佳實踐 * 挑選非關鍵 namespace。 * 為團隊定義時區、節奏、觀測指標。 * 用 Prometheus 驗證節能成效。 --- ### 🔁 Descheduler:讓資源會流動 #### 核心概念 * 定期掃描節點,重新分配 Pod,平衡利用率。 * 「Descheduler:Pod 的搬家達人。」 #### 常用策略 * `RemoveDuplicates`:移除重複調度的 Pod。 * `LowNodeUtilization`:清空過於閒置的節點。 * 「它幫你清除懶惰的 Pod。」 #### 與 Autoscaler 的協作原則 * **錯開時序**:Descheduler 每 1h,CA 每 5min。 * **避免循環地獄**:Descheduler 移出 → CA 誤判擴容 → Scheduler 重排 → CA 又縮容。 * 「別讓兩個 Scheduler 打架。」 --- ### 🧠 HPA + Autoscaler:讓叢集更聰明地擴縮 #### 傳統 HPA vs. 智慧擴縮 | 傳統 HPA | HPA + Autoscaler | | --------- | ---------------- | | 自顧自擴容 | 叢集層協調 | | 單一指標(CPU) | 多維度(效能+成本) | | 「狂夾菜」 | 「大家分菜吃」 | #### 成效與啟示 * 降低 Overutilization 5x。 * 減少 Overprovisioning 7x。 * 分配效率提升 1.8x。 > 「在論文裡它贏了;在 production 裡,還沒人敢試。」 --- ### 🔺 GreenPod 藍圖:節能 → 流動 → 自治 | 階段 | 工具 | 功能 | 成果 | | ------------ | ---------------- | ----- | ----- | | 🌙 Sleep | kube-green | 離峰休眠 | 節能、省錢 | | 🔁 Rebalance | Descheduler | 資源再分配 | 效率、穩定 | | 🧠 Govern | HPA + Autoscaler | 智慧擴縮 | 自治、永續 | > 「三劍合璧,節能無敵。」 --- ### 🧾 落地前的三個現實檢查 1️⃣ **組織準備度** * 有共識嗎?有維護人嗎? * 「沒文化支持,再好的工具也只是擺設。」 2️⃣ **觀測能力** * 能看到每個 namespace 的資源利用率? * 監控與告警會不會在睡眠時亂報? * 「沒有觀測,就像在黑暗中開車。」 3️⃣ **成本意識** * 真的在意雲帳單嗎? * 有節能 KPI 嗎?有回饋嗎? * 「沒有人想付帳單,但每個人都在用資源。」 --- ### ♻️ 從 FinOps 到 GreenOps * FinOps 看帳單,GreenOps 看地球。 * FinOps 是治理成本,GreenOps 是治理能源。 * 交集是 **Responsible Governance(責任治理)**。 * 「一個月底對財務報告,一個月底對地球報告。」 --- ### 🌆 責任治理:叢集的公民化運動 * 叢集也該有行為準則。 * 每個 namespace 都該交稅(metrics)。 * 「一個成熟的叢集,不只是穩定,更懂得負責任。」 --- ### 🌅 結語:Sustainable Systems > **永續的系統,來自有意識的工程。** > **Sustainable systems start with responsible minds.** > 我們寫的每一行 YAML、每一段自動化, > 其實都在形塑一種文化。 > 「如果叢集會納稅,我們早就拿到綠能獎了。」 --- ### 🙏 感謝 & 招募 * 謝謝大家聆聽。 * 有問題請發問,沒問題也可以發問。 * 我們在 MaiCoin Group 招人中, 一起打造會思考、會節能、會開會的叢集。 --- **#KubeSummit2025 #FinOps #GreenOps #Kubernetes #SRE #Sustainability** ## 討論區 > 歡迎在此進行討論與 Q&A 分頁資源浪費恐懼來自於筆電記憶體不足 ~~因為賺不夠多才會 Care 雲端成本花多少~~ ~~GreenOps,商人追求的是良心還是名聲?~~ ~~老闆的夢想是在 Big Data 中挖掘出商機洞見~~ 聽起來 Smart HPA 有點像是 [krr](https://github.com/robusta-dev/krr),依據 Workload 的歷史用量給予資源減量的建議 Smart HPA 還在學術研究階段,怕.jpg 如果用 KDEA 的 Cron Scaler 應也可以達成夜間關閉的需求 ## 相關資源 - 投影片連結:[連結在此](https://www.slideshare.net/slideshow/kubesummit-2025-k8s-n/283888188) - 相關文件:(待更新)
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up