--- title: 機器學習1 12/16 tags: 機器學習 --- Elwing 周凡剛 birdfan8814@gmail.com fb: Fan-Gang Chou 共筆: * [機器學習 - 12/16共筆 - Google 文件](https://docs.google.com/document/d/1bz5RBxq8FPoQkzA5Yr-0XMUcA_USesql9oyTFwTrTBA/edit#heading=h.581xx291vjkv) --- ## 機器學習 深度學習 ->統計 機器學習:表格 固定欄位 傳統統計 比較難 深度學習:抽象型 圖片 聲音 文字 模仿人類-> 神經網路 本地端:2018/3月 pycharm 版本 才能開jupyter notebook 線上環境:colab 安裝python 3.7 安裝tensorflow 2.0.0 安裝python 3.8 就安裝最新的 import tenserflow.keras.xxx (原import keras.xxx)  資料 遠比演算法還重要 分析的方式->演算法 透過演算法學習後-> 創造 模型 有資料 跟演算法 能做模型 資料分成兩部分: * 訓練資料 * 測試資料 人判斷時: * 邏輯 * 經驗 --- | input | output | | ----- | ---------------------------- | | | 選擇題(分類)classification | | | 計算題(迴歸)regression | | | 無答案之選擇題:比相似度(分群)cluster| 有給答案的訓練 會比較好 有標註答案 準確度比較好 分類會比較好 # 分類 pycharm安裝 scikit-learn colab都內建有了 ## sklearn * [7. Dataset loading utilities — scikit-learn 0.23.2 documentation](https://scikit-learn.org/stable/datasets/index.html) numpy :1.19.4 ## csv (comma-separated values) 用逗號分隔 姓名,身高 \n Elwing, 175\n "Elwing, Mr.Chou",180 \n * [pandas.DataFrame.to_csv — pandas 1.1.5 documentation](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html) 機器學習ML:千到萬的資料合適 深度學習DL:萬到十萬的資料合適 ---- # classification 分類 ## 150種 3種分類 鳶尾花  axis= 0 drop列 axis= 1 drop行  input=x output=y model_selection 驗證模型 train_test_split 訓練資料 訓練跟測試模型的比例 -> 9:1/8:2 ## 決策樹: 可解釋性 決策點 ex:petal width 決策原因 gini 有多少筆資料 samples value 有三種 各有多少個 class 三種最多的是什麼 gini 信心程度 猜錯機率 取log 乘除變加減 取log 聲音 強度 分貝 log --- 過擬合 過度訓練 訓練100%->測試bad 後剪: sklearn 不支持 前剪:  * [sklearn.tree.DecisionTreeClassifier — scikit-learn 0.23.2 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html?highlight=sklearn%20tree%20decisiontree) --- imagenet 分類比賽 --- ## regression 迴歸 決策點 MSE (mean squared error)->分布半徑 回歸版的吉尼係數 (預測減正確的平方) samples value MAE RMSE 用來比較 不推薦 r2 score= 1- b/a 比較 ## regression LSTAT: 決策點 mse: (mean squared error) $\frac{1}{n}\sum_{i=1}^n (p_i-平均值)^2 \quad$ samples: 樣本數 value: 樣本平均數 gini=0 ~> mse=0 --- 度量 MSE:$\frac{1}{n}\sum_{i=1}^n (pre_i-正確_i)^2 \quad$ MAE:$\frac{1}{n}\sum_{i=1}^n |pre_i-正確_i| \quad$ RMSE:$\sqrt{MSE} \quad$ ---- RM 房間個數 左邊 便宜 ->在意環境 學區 右邊 貴 ->在意坪數 空氣
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up