# Artificial Intelligence Fundamentals 因緣際會之下,我修了 IBM 提供的 Artificial Intelligence Fundamentals 課程。這是一門基礎 AI 知識的入門課,涵蓋了機器學習、自然語言處理等核心概念。雖然一開始只是想增廣見聞,但隨著課程推進,我逐漸體會到 AI 技術背後的邏輯與應用價值。最後,我也順利通過考核,獲得了官方證書!  這份筆記將記錄我的學習重點與心得,希望能成為日後複習的依據,也能和有興趣的朋友們分享。 ## Chapter 1 Introduction to Artificial Intelligence ### 1. Artificial Intelligence 的定義 人工智慧(AI):指電腦或機器展現出類似人類的智慧行為,例如學習、推理、規劃、理解語言、做決策。 目的:讓機器能夠模仿甚至增強人類的思考過程。 ### 2. AI 與 Augmented Intelligence 的差異 **Artificial Intelligence**:企圖讓機器自主完成任務,有時甚至超越人類能力。 **Augmented Intelligence**(增強智慧):不是取代人類,而是協助人類做出更好的決策。 例子:醫療診斷輔助系統 → 醫生依然是最終決策者。 ### 3. 三個層級的人工智慧 **Narrow AI**:專注單一領域任務,例如語音助理、影像辨識。 **Broad AI**:能處理較廣範圍的相關任務,能整合到商業流程中。 **General AI**:理論上能做所有人類能做的智力工作,具備普遍推理能力,目前尚未實現。 ### 4. AI 歷史 過去:1950s → AI 概念提出,象徵性推理、專家系統。 現在:以 機器學習、深度學習為核心,應用於醫療、金融、交通、娛樂。 未來:邁向 Broad AI甚至 General AI,與人類更緊密協作。 ### 5. 機器學習(Machine Learning) 定義:一種 AI 方法,讓系統能從資料中學習模式,逐步改善表現,而不是僅靠人類寫死的程式規則。 核心:演算法 + 大量資料 + 訓練過程。 **三種資料型態** **Structured data(結構化資料)** 固定格式,適合存放在資料庫。例:航班時刻表、交易紀錄。 **Semi-structured data(半結構化資料)** 部分結構化,使用 metadata 組織。例:XML、JSON。 **Unstructured data(非結構化資料)** 沒有固定格式,難以用傳統工具處理。例:文字、圖片、音訊、影片。 **如何結構化非結構化資料?** ML 將非結構化資料轉換成特徵(features),再進行模型訓練。與傳統系統不同,ML 給出機率性判斷,而不是硬性的「是/否」答案。 **如何用機率計算解決問題?** ML 演算法透過統計模型,輸出不同可能結果的機率。人類再依據這些機率與情境判斷做決策。🔹 例子:醫療診斷 → AI 提供 70% 可能是流感,25% 可能是 COVID,5% 可能是過敏。 ### 6. 機器學習分析資料的三種方法 **Supervised learning(監督式學習)**:使用已標記的資料來訓練模型。 例:垃圾郵件分類。 **Unsupervised learning(非監督式學習)**:資料未標記,演算法自動找出群組或關聯。 例:顧客分群分析。 **Reinforcement learning(強化學習)**:透過 trial & error 以及獎勵機制學習最佳行為。 例:AI 下棋、機器人走迷宮。 ### 7. 理想的人機關係 AI 與人類互補:AI 提供高速計算、模式辨識,人類提供經驗、倫理與價值判斷。 最佳情境:人類不是被 AI 取代,而是因為 AI 的幫助而做出更好、更快的決策。 ## Chapter 2 Natural Language Processing and Computer Vision ### 自然語言處理(Natural Language Processing, NLP)的基礎 **定義**:讓電腦理解、解釋、生成自然語言的技術。 **語言特性**:非結構化(Unstructured Data),需轉換成結構化才能運算。 **處理流程**:Tokenization → 分類/排序 → 建立結構 → 提取意義。 **案例**:IBM Project Debater(學習 → 建立立場 → 組織證據 → 回應對手)。 ### NLP 推導意義 Entities(實體):人、地點、物件(名詞)。 Relationships(關係):實體之間的連結。 Emotion Detection(情緒偵測):辨識情緒類型。 Sentiment Analysis(情感分析):判斷正面 / 負面 / 中立。 ### 分類問題(Classification Problem) 定義:將資料分到特定類別。電腦要判斷「這個東西屬於哪一類?」 解法: **決策樹(Decision Tree)**:透過一連串判斷,最後把資料分到一個類別。 **支持向量機(Support Vector Machine, SVM)**:把資料畫在平面或空間裡,用一條「最佳分隔線」把不同類別分開。 **人工神經網路(Artificial Neural Network, ANN)**:模仿人腦神經元,層層傳遞訊號,最後輸出結果。 ### 聊天機器人(Chatbots) 運作方式: 前端(Frontend):與使用者互動。 後端(Backend):處理邏輯,記住對話。 核心元素: Intent(意圖)→ 動詞,使用者需求。 Entity(實體)→ 名詞,相關資訊。 Dialog(對話流程)→ 對話回應路徑。 應用:FAQ、自動客服、預約/訂單系統。 NLP 實際應用:翻譯、情感分析、語音助理。 ### 電腦視覺(Computer Vision, CV) #### **影像分類**(Image Classification):辨識影像內容。 #### **卷積神經網路**(Convolutional Neural Network, CNN): 卷積層(Convolutional Layer) → 特徵擷取(邊緣、形狀) 池化層(Pooling Layer) 把圖片「壓縮」,只留下最重要的特徵 → 降低維度、壓縮資訊 全連接層(Fully Connected Layer) → 分類(把前面萃取的特徵綜合起來,最後輸出答案。) CNN = 三步驟工作:卷積層:找細節(邊緣、形狀) → 池化層:縮圖、抓重點 → 全連接層:判斷結果(貓 or 狗) #### **生成對抗網路**(Generative Adversarial Network, GAN): **生成器(Generator)**:創造影像 負責「創造」影像,一開始會亂畫,但逐步學習如何畫得像真的。 **判別器(Discriminator)**:檢測真偽 負責「檢查」影像是真是假。它要分辨一張圖是人類拍的,還是生成器畫的。 **對抗訓練** → 生成逼真影像 生成器不斷嘗試欺騙判別器,判別器則不斷加強識破 → 最後生成器能畫出非常逼真的圖。 **應用**:醫療影像診斷、自駕車、人臉辨識、Deepfake/AI 藝術。 ## Chapter 3 機器學習(Machine Learning, ML)與深度學習(Deep Learning, DL) ### AI、ML、DL 的區別 **人工智慧(Artificial Intelligence, AI)** 廣義概念,指電腦能展現出類似人類智慧的行為(推理、決策、預測)。 **機器學習(Machine Learning, ML)** AI 的一個子集,透過資料與經驗讓系統「學習」,不必完全依靠人工寫死規則。 **深度學習(Deep Learning, DL)** ML 的一個子集,利用人工神經網路(Artificial Neural Networks, ANN) 的多層結構來解決更複雜問題。 圖像關係:AI > ML > DL(套娃式包含關係)。 ### 三種學習方式 **監督式學習(Supervised Learning)**:使用「標記過的資料」訓練模型。 例:垃圾郵件分類(輸入 = 郵件,標籤 = 垃圾/正常)。 **非監督式學習(Unsupervised Learning)**:沒有標記的資料,系統自己找規律與分群。 例:顧客分群、購物行為模式。 **強化學習(Reinforcement Learning, RL)**:Trial & Error(試誤學習),透過「獎勵與懲罰」學最佳策略。 例:AlphaGo 下棋、自駕車學習路徑。 ### 機器學習的經典方法 **決策樹(Decision Tree)**:像問答流程圖,逐步判斷。 **線性迴歸(Linear Regression)**:用一條直線來預測數值(如房價)。 **邏輯迴歸(Logistic Regression)**:預測二元結果(是/否、1/0),如判斷是否會貸款違約。 ### 神經網路(Neural Networks) 靈感:模仿人腦的神經元(Neurons)。 **基本單元:感知器(Perceptron)** **輸入層** → 接收資料 **加權和(Weighted Sum)** → 計算影響力 **激活函數(Activation Function)** → 決定是否傳遞訊號 **輸出層** → 給出預測結果 ### 機器學習的 Trial-and-Error 過程 就像人類學習 → 一開始會做錯,但系統會根據**反饋(Feedback)**逐步修正。 強化學習(Reinforcement Learning)正是基於這種方式:不斷嘗試 → 根據獎勵改進 → 越來越好。 ### 深度學習(Deep Learning, DL) 定義:一種 ML,使用多層神經網路(Multilayer Perceptrons, MLPs)處理複雜數據。 生態系統(Ecosystem): ● 卷積神經網路(Convolutional Neural Network, CNN)→ 影像辨識 ● 循環神經網路(Recurrent Neural Network, RNN)→ 語音/文字 ● 生成對抗網路(Generative Adversarial Network, GAN)→ 影像生成 ● Transformer 模型(例如 GPT)→ 語言理解與生成 ## Chapter 4 Run AI Models with IBM Watson Studio ### **IBM Watson Studio是什麼?** → 一個**整合開發環境(Integrated Development Environment, IDE)**,專門用來構建與管理 AI / ML 專案。 功能:構建、訓練、測試、管理 機器學習模型(Machine Learning Models) 目的:讓團隊能更快協作並開發 AI 解決方案 輸出:結果可以存成 工作模型 或 Jupyter Notebook(.ipynb) ### Watson Studio 的特色與好處 **AutoAI**:自動嘗試多種演算法,選出最佳模型 **可視化介面**:不需要寫程式也能操作 **雲端儲存**:方便共享資料 **Notebook 支援**:進階使用者可用程式控制 ### 專案設置流程 **Provision Watson Studio**(開通服務) **建立新專案(New AI Project)與Cloud Object Storage** **匯入資料集(Dataset)** **建立模型(用 AutoAI)** ● 自動產生多個模型(決策樹、隨機森林、迴歸…) ● 訓練並比較 → 選出最佳模型 **運行 Prediction Experiment**(測試新資料的預測能力) **評估結果(Confusion Matrix)** **TP(真陽性)**:判斷對的「有」 **TN(真陰性)**:判斷對的「沒有」 **FP(偽陽性)**:誤報 **FN(偽陰性)**:漏判 可計算 Accuracy、Precision、Recall、F1-score ### 總結: 1.Watson Studio = AI/ML 專案工作室 2.提供完整流程:資料 → 模型 → 預測 → 評估 → 儲存 3.AutoAI 幫助快速建模 4.混淆矩陣是評估模型準確性的工具 5.結果能存成 Notebook,靈活度高 ## Chapter 5 AI 倫理(AI Ethics) ### Five Pillars of AI Ethics 公平(Fairness)、穩健(Robustness)、可解釋性(Explainability)、透明度(Transparency)、隱私(Privacy) #### 公平(Fairness) 定義:確保不同個體或群體獲得公平對待。 目標:透過演算法設計與數據清理,減少不必要的偏差。 **Protected Attributes(受保護屬性)**:區分族群的特徵,例如性別、種族、年齡。 **Privileged Groups(特權群體)**:傳統上獲得較多有利結果。 **Unprivileged Groups(弱勢群體)**:傳統上較少或無法獲得有利結果。 **Bias(偏差/偏見)**:一種系統性錯誤,可能導致不公平決策(無論是否故意)。 #### 穩健(Robustness) 定義:AI 系統能應對異常情況或惡意攻擊,而不造成傷害。 **對抗性攻擊(Adversarial Attacks)**:故意利用 AI 系統漏洞,達到惡意目的。 **Poisoning(汙染攻擊)**:在訓練階段注入惡意數據,影響模型行為。 **Evasion(規避攻擊)**:在輸入中添加干擾,欺騙模型做錯誤判斷。 #### 可解釋性(Explainability) 定義:一般人能理解 AI 系統為何做出某個預測或推薦。 **Interpretability(可解讀性)**:觀察者能理解某個決策的原因。 **Explainability(可解釋性)**:描述 AI 系統如何得到結果的過程。 價值:提高信任度,方便檢查錯誤,協助符合法規。 #### 透明度(Transparency) 定義:公開 AI 系統相關資訊 例如:訓練資料來源、設計決策、模型建立與評估方法、部署流程 **治理(Governance)**:確保 AI 的開發與部署遵守內部政策與規範。 **涉及角色**:業務部門、人資、法務、開發團隊都可能參與透明度的治理。 #### 隱私(Privacy) 定義:在使用個人或敏感資料訓練模型時,必須保護個人隱私。 技術手段: **模型匿名化(Model Anonymization)**:移除或模糊化個人識別資訊。 **差分隱私(Differential Privacy)**:在數據中引入隨機噪聲,降低個人被識別的風險。 **資料最小化(Data Minimization)**:模型訓練後,僅保留必要的資料,刪除或壓縮其他資訊。 ### 總結: 公平(Fairness) → 減少偏差,避免歧視。 穩健(Robustness) → 防禦異常輸入與惡意攻擊。 可解釋性(Explainability) → 讓人理解 AI 決策的理由。 透明度(Transparency) → 開放資料來源、設計與治理流程。 隱私(Privacy) → 使用技術手段保護個人與敏感資訊。