# Grow with Google 機器學習共筆 ## 上午場 大綱: 認識機器學習 時間: 約90分鐘 ### 連結: - g.co/quickdraw - g.co/quickdrawdata ### 規則式方法 vs 機器學習: - 規則式方法:規則定義明確、改善切入點為演算法和網路 - 機器學習:從資料模式中學習、改善切入點為進一步的資料 ### 題目: - 將歌曲依照字母排序: 規則式 - 顯示搜尋結果: 兩者皆有 - 根據地點預測房價: 機器學習 - 處理線上付款: 規則式 - 將相片中的物件分類: 機器學習 ### 機器學習流程: - 重視使用者需求 - 定義目標 - 收集資料 (85% 的時間) - 收集 - 處理 - 標記 - 訓練及測試模型 (8:1:1) - Training Dataset: 教材 - Validation Dataset: 小考 - Testing Dataset: 大考 - 預測及評估 (回到 `重視使用者需求` 或 `收集資料`) ### 偏差/偏見: - 科技來自於人性,人為偏差導致科技偏差 - 收集資料時需思考訓練的內容 ### 資料隱私: - 訓練端 - 醫療資料 - 收集資料時須將無關資料刪除 - 去識別化 - 使用端 - 存取權 - 使用者身分 ### 架構: - 人工智慧 - 機器學習 - 深度學習 ### 要素: - 大數據 - 演算法 - 科技 ### 情境: - 分類: 分成多類 - 分群: 組成成分 - 迴歸: 給數值 - 序列預測: 趨勢預測 - 樣式轉移: 形式轉換、結合 ### 題目: - 根據使用者先前購買的內容提供商品建議: 序列預測 - 將電子郵件標示為垃圾郵件: 分類 - 根據購買新產品的一群使用者找出共同請校: 分群 - 為影片加上說明文字: 樣式轉移 - 根據手機移動模式判斷使用者的健身活動: 分類 - 預測密碼強度: 分類、迴歸 - 辨識相片中的知名地標: 分類 - 提供拼字校正建議: 分群 - 預測廣告品質分數: 迴歸 - 根據時段和路況預測抵達時間: 迴歸 ## 下午場 (上) 大綱: 認識類神經網路 時間: 約90分鐘 ### 連結: - https://playground.tensorflow.org/ - https://developers.google.com/machine-learning/crash-course/introduction-to-neural-networks/playground-exercises - g.co/teachablemachine ### 結構: - 輸入層 - 隱藏層 - 輸出層 - Test Loss - Train Loss ### 觀念: - 輸入 - 活化函數 - 不活化神經元 - 活化神經元 ### 常見活化函數: - s 活化函數: 將加權總和轉換成介於0和1的值 - ReLU (線性整流): 較s活化函數好 ## 下午場 (下) 大綱: 小組討論/新聞題目 時間: 約一小時 ### 題目: - 無接觸經濟 https://ctee.com.tw/industrynews/technology/325979.html A: 分類 - 居家隔離個人定位追蹤系統 https://www.digitimes.com.tw/tech/dt/n/shwnws.asp?cnlid=13&id=0000578997_KTQ8RKX5LM2GSD619JPDD A: 條件式規則 - 人工智慧女主播 https://reurl.cc/q82kKE A: 序列預測、樣式轉移 - 確診案例數預測 https://aidea-web.tw/covid-19 A: 迴歸、序列預測 - Alphaloan數位風控系統 https://www.bnext.com.tw/article/59427/alphaloan A: 分群、迴歸 - EVAS語音轉病例 https://money.udn.com/money/story/11799/4932683 A: 分類、樣式轉移 - 資策會研發AI假訊息快篩平臺 https://www.ithome.com.tw/news/139764 A: 分類、分群、迴歸 ### AI應用想法要素 - 目標、問題 - 影響、好處 - 問題、類型 - 資料、來源 - 疑慮 (隱私權、偏差) ### ML應用發表 - 旅遊行程表: 分群、序列預測 - 偏鄉醫療診治: 分類、分群、樣式轉移 - 憂鬱症提前發現: 分類、迴歸 - 文案/論文生成: 分類、樣式轉移 - 用極少時間做出最佳有效決定: 分類、分群、迴歸 - 旅遊位置: 分類、序列偵測