# 機器學習工作坊1 重點概念整理
> [name=Yun-Tao Chen]
> [time=Wed, Sep 18, 2019 12:05 PM]
**機器學習 (Machine Learning)** 領域的原物料是**大量的資料**,也是俗稱的**大數據**,
有了大數據後,就可以透過資料來訓練機器學習模型,目的就是讓機器學習模型能夠 “看懂” 資料。
機器學習演算法核心是機率模型,有許多參數可以調整,使得模型能夠輸出更接近正確的資訊。
參數調整的方式則是演算法的一大重點,與訓練模型所用的資料相輔相成
準備資料時,我們必須要蒐集齊全每一筆資料的 input 端與 output 端,例如做貓咪影像辨識時,我們必須提供大量已知是**貓的圖片**,以及**不是貓的圖片**,讓機器學習模型自動去調整參數,得到一個**能夠辨識一張圖片是否是貓**的模型。
評估機器學習模型的策略,以及資料準備的處理方式,都是機器學習領域當中,非常重要的環節。有好的評估準則,才能讓我們挑出好的機器學習模型,用在適合的情境當中。在做分類問題時,統計學當中有三個很常用的指標,分別為**精確率 (P