# 資料分析101 ## data analysis 101 ### using PowerBI ### 徐綜祥 --- ## 什麼是資料分析? * 從大量的資料中,萃取有價值的資訊,並轉化為可行動的洞見,以幫助決策。 * 就像淘金一樣,從沙礫中篩選出黃金。 ![Gemini_Generated_Image_gb1ta7gb1ta7gb1t](https://hackmd.io/_uploads/BkVP-uBlyg.jpg =40%x) --- ## 資料分析的應用 * 商業決策:市場分析、顧客關係管理、產品開發 * 運籌規劃:交通流量預測、物流最佳化、運輸效率提升 * 金融保險:風險評估、詐欺偵測、投資策略 * 醫療保健:疾病預測、藥物研發、個人化醫療 --- ## 資料分析流程 1. **提出問題**: 明確分析目標,例如: * 捷運哪個站點的客流量最大? * 哪些因素影響公車的準點率? * 如何優化物流路線以降低成本? --- ## 資料分析流程 2. **取得資料**: 從各種來源收集資料,例如: * 政府開放資料平台 (data.gov.tw) * 公司內部資料庫 * 問卷調查 * 感測器數據 --- ## 資料分析流程 3. **資料清理與轉換 (ETL)**: 清洗、轉換資料,使其符合分析需求。 * **E (Extract)**: 從資料來源擷取資料。 * **T (Transform)**: 轉換資料格式、清理錯誤資料、整合不同來源資料等。 * **L (Load)**: 將處理好的資料載入分析工具。 ![image alt](https://cdn.prod.website-files.com/634fa785d369cb60d80b6dd1/6393298e18f50e62a1657530_ETL%20process%20DataChannel.webp =50%x) --- ## 資料分析流程 4. **資料分析**: 使用統計方法、機器學習等技術分析資料,找出規律和洞見。 * 例如:計算平均值、標準差、相關係數等 * 例如:建立預測模型,預測未來趨勢 --- ## 資料分析流程 5. **視覺化呈現**: 將分析結果以圖表、儀表板等方式呈現,方便理解和溝通。 * 例如:使用長條圖比較不同運輸工具的載客量 * 例如:使用地圖呈現交通事故發生的熱點區域 --- ## 資料分析前的思考 * 資料的來源和可靠性? * 資料是否來自可靠的來源? * 資料是否經過驗證? --- * 資料的格式和結構? * 資料的格式是什麼 (例如:CSV、Excel、JSON)? * 資料的欄位和資料類型? --- * 需要哪些資料?如何取得? * 哪些資料與分析目標相關? * 如何收集這些資料? --- * 分析的目標和方法? * 想要從資料中得到什麼資訊? * 使用什麼方法分析資料? --- * 如何呈現分析結果? * 使用哪些圖表或儀表板? * 如何讓分析結果易於理解和溝通? --- ## PowerBI --- ## Power BI Desktop 簡介 * 由微軟開發的 **免費** 資料視覺化和商業智慧工具。 * 讓使用者能輕鬆地 **連接、轉換、視覺化** 各種來源的資料。 * 透過互動式報表、儀表板等方式,**洞察資料**、**發掘趨勢**、**輔助決策**。 --- ## Power BI Desktop 的功能 * **資料連結**: 支援多種資料來源,例如: * Excel、CSV、資料庫、雲端服務、網路 API 等 * **資料轉換**: * 強大的 Power Query 編輯器,可進行資料清理、轉換、整合等操作。 --- ## Power BI Desktop 的功能 * **資料建模**: * 建立資料表之間的關聯性,構建資料模型。 * **視覺化**: * 豐富的視覺化圖表類型,例如:長條圖、折線圖、地圖、散佈圖等。 * 可自訂圖表樣式、顏色、標籤等,製作專業的視覺化報表。 --- ## Power BI Desktop 的優勢 * **易於使用**: * 直觀的拖放式操作介面,即使沒有程式設計背景也能輕鬆上手。 * **強大的功能**: * 提供豐富的資料轉換和視覺化功能,滿足各種資料分析需求。 --- ## Power BI Desktop 的優勢 * **互動式體驗**: * 製作互動式報表和儀表板,使用者可以自行篩選、鑽取資料,深入探索資料洞見。 * **免費且跨平台**: * Power BI Desktop 可免費下載使用,並支援 Windows、Mac 等作業系統。 --- ## 類似的 No-Code 工具 * **Tableau Public**: 免費的資料視覺化工具,提供豐富的圖表類型和互動式功能。 * **Google Looker Studio**: 免費的資料視覺化工具,可連接 Google Analytics、Google Ads 等 Google 服務。 --- ## 實作 ### 範例資料-商業分析 ### [Source](https://learn.microsoft.com/zh-tw/power-bi/create-reports/desktop-excel-stunning-report) ---- #### 範例資料-商業分析 ETL實作目標: - [ ] 售出單位資料型態 轉為 整數 - [ ] Segments 轉為 大寫 - [ ] Month Name 改名為 Month - [ ] 剔除Product:Montana ---- ### 範例資料-商業分析 - [ ] 新增值:總銷售額(total units sold) ```excel Total Units Sold = SUM(financials[Units Sold]) ``` - [ ] 新增表:日期 ```DAX Calendar = CALENDAR(DATE(2013,01,01),Date(2014,12,31)) ``` - [ ] 兩表建立連結 Financials[Date] <--> Calendar[Date] ---- ### 範例資料-商業分析 目標畫面 ![power-bi-report-by-numbers](https://hackmd.io/_uploads/Hkz13_Bxyx.png) ---- ### 範例資料-商業分析 1. 標題 1. 折線圖 (profit vs date) 1. 氣泡圖 with GIS (profit vs country) 1. 群組直方圖 (Sales by Products and Segment) 1. 月份選擇 --- ## 實作 ### 真實資料-高雄民營停車場 ### [Source](https://data.gov.tw/dataset/47055) ### [datasets](https://nkusto365-my.sharepoint.com/:x:/g/personal/c109118106_office365_nkust_edu_tw/EVk9WVNlYNJJjyRT9eS68sYBAI6h2Un349BBZ0PQItccDA?e=rpwd3l) ---- ### 真實資料-高雄民營停車場 目標畫面: ![圖片](https://hackmd.io/_uploads/r15qetSe1x.png) ---- 1. 氣泡圖 with GIS(行政區 or 型式) 1. 卡片(小型車、大型車、機車) 1. 分類(行政區、型式) --- ### 資源分享 [PowerBI 微軟官方教學](https://learn.microsoft.com/zh-tw/training/career-paths/data-analyst) [TDX 運輸資料流通服務](https://tdx.transportdata.tw/) [SEGIS社會經濟資料服務平台](https://segis.moi.gov.tw/STATCloud/Index) [TGOS](https://www.tgos.tw/tgos) data.gov.tw --- ## 聯絡資訊 徐綜祥 frankhsu@nkust.edu.tw
{"lang":"zh-TW","slideOptions":"{\"allottedMinutes\":3.75}","title":"資料分析概論","description":"從大量的資料中,萃取有價值的資訊,並轉化為可行動的洞見,以幫助決策。","contributors":"[{\"id\":\"22bac1e3-3e7c-4404-8035-96572a57aa06\",\"add\":4777,\"del\":979}]"}
    217 views