Artificial Intelligence Fundamentals

# Artificial Intelligence Fundamentals 因緣際會之下，我修了 IBM 提供的 Artificial Intelligence Fundamentals 課程。這是一門基礎 AI 知識的入門課，涵蓋了機器學習、自然語言處理等核心概念。雖然一開始只是想增廣見聞，但隨著課程推進，我逐漸體會到 AI 技術背後的邏輯與應用價值。最後，我也順利通過考核，獲得了官方證書！　這份筆記將記錄我的學習重點與心得，希望能成為日後複習的依據，也能和有興趣的朋友們分享。 ## Chapter 1 Introduction to Artificial Intelligence ### 1. Artificial Intelligence 的定義人工智慧（AI）：指電腦或機器展現出類似人類的智慧行為，例如學習、推理、規劃、理解語言、做決策。目的：讓機器能夠模仿甚至增強人類的思考過程。 ### 2. AI 與 Augmented Intelligence 的差異 **Artificial Intelligence**：企圖讓機器自主完成任務，有時甚至超越人類能力。 **Augmented Intelligence**（增強智慧）：不是取代人類，而是協助人類做出更好的決策。例子：醫療診斷輔助系統 → 醫生依然是最終決策者。 ### 3. 三個層級的人工智慧 **Narrow AI**：專注單一領域任務，例如語音助理、影像辨識。 **Broad AI**：能處理較廣範圍的相關任務，能整合到商業流程中。 **General AI**：理論上能做所有人類能做的智力工作，具備普遍推理能力，目前尚未實現。 ### 4. AI 歷史過去：1950s → AI 概念提出，象徵性推理、專家系統。現在：以機器學習、深度學習為核心，應用於醫療、金融、交通、娛樂。未來：邁向 Broad AI甚至 General AI，與人類更緊密協作。 ### 5. 機器學習（Machine Learning）定義：一種 AI 方法，讓系統能從資料中學習模式，逐步改善表現，而不是僅靠人類寫死的程式規則。核心：演算法 + 大量資料 + 訓練過程。 **三種資料型態** **Structured data（結構化資料）** 固定格式，適合存放在資料庫。例：航班時刻表、交易紀錄。 **Semi-structured data（半結構化資料）** 部分結構化，使用 metadata 組織。例：XML、JSON。 **Unstructured data（非結構化資料）** 沒有固定格式，難以用傳統工具處理。例：文字、圖片、音訊、影片。 **如何結構化非結構化資料?** ML 將非結構化資料轉換成特徵（features），再進行模型訓練。與傳統系統不同，ML 給出機率性判斷，而不是硬性的「是/否」答案。 **如何用機率計算解決問題?** ML 演算法透過統計模型，輸出不同可能結果的機率。人類再依據這些機率與情境判斷做決策。🔹 例子：醫療診斷 → AI 提供 70% 可能是流感，25% 可能是 COVID，5% 可能是過敏。 ### 6. 機器學習分析資料的三種方法 **Supervised learning（監督式學習）**:使用已標記的資料來訓練模型。例：垃圾郵件分類。 **Unsupervised learning（非監督式學習）**:資料未標記，演算法自動找出群組或關聯。例：顧客分群分析。 **Reinforcement learning（強化學習）**:透過 trial & error 以及獎勵機制學習最佳行為。例：AI 下棋、機器人走迷宮。 ### 7. 理想的人機關係 AI 與人類互補：AI 提供高速計算、模式辨識，人類提供經驗、倫理與價值判斷。最佳情境：人類不是被 AI 取代，而是因為 AI 的幫助而做出更好、更快的決策。 ## Chapter 2 Natural Language Processing and Computer Vision ### 自然語言處理（Natural Language Processing, NLP）的基礎 **定義**：讓電腦理解、解釋、生成自然語言的技術。 **語言特性**：非結構化（Unstructured Data），需轉換成結構化才能運算。 **處理流程**：Tokenization → 分類/排序 → 建立結構 → 提取意義。 **案例**：IBM Project Debater（學習 → 建立立場 → 組織證據 → 回應對手）。 ### NLP 推導意義 Entities（實體）：人、地點、物件（名詞）。 Relationships（關係）：實體之間的連結。 Emotion Detection（情緒偵測）：辨識情緒類型。 Sentiment Analysis（情感分析）：判斷正面 / 負面 / 中立。 ### 分類問題（Classification Problem）定義：將資料分到特定類別。電腦要判斷「這個東西屬於哪一類？」解法： **決策樹（Decision Tree）**:透過一連串判斷，最後把資料分到一個類別。 **支持向量機（Support Vector Machine, SVM）**:把資料畫在平面或空間裡，用一條「最佳分隔線」把不同類別分開。 **人工神經網路（Artificial Neural Network, ANN）**:模仿人腦神經元，層層傳遞訊號，最後輸出結果。 ### 聊天機器人（Chatbots）運作方式：前端（Frontend）：與使用者互動。後端（Backend）：處理邏輯，記住對話。核心元素： Intent（意圖）→ 動詞，使用者需求。 Entity（實體）→ 名詞，相關資訊。 Dialog（對話流程）→ 對話回應路徑。應用：FAQ、自動客服、預約/訂單系統。 NLP 實際應用：翻譯、情感分析、語音助理。 ### 電腦視覺（Computer Vision, CV） #### **影像分類**（Image Classification）：辨識影像內容。 #### **卷積神經網路**（Convolutional Neural Network, CNN）：卷積層（Convolutional Layer） → 特徵擷取（邊緣、形狀）池化層（Pooling Layer）把圖片「壓縮」，只留下最重要的特徵 → 降低維度、壓縮資訊全連接層（Fully Connected Layer） → 分類(把前面萃取的特徵綜合起來，最後輸出答案。) CNN = 三步驟工作：卷積層：找細節（邊緣、形狀） → 池化層：縮圖、抓重點 → 全連接層：判斷結果（貓 or 狗） #### **生成對抗網路**（Generative Adversarial Network, GAN）： **生成器（Generator）**：創造影像負責「創造」影像，一開始會亂畫，但逐步學習如何畫得像真的。 **判別器（Discriminator）**：檢測真偽負責「檢查」影像是真是假。它要分辨一張圖是人類拍的，還是生成器畫的。 **對抗訓練** → 生成逼真影像生成器不斷嘗試欺騙判別器，判別器則不斷加強識破 → 最後生成器能畫出非常逼真的圖。 **應用**：醫療影像診斷、自駕車、人臉辨識、Deepfake/AI 藝術。 ## Chapter 3 機器學習（Machine Learning, ML）與深度學習（Deep Learning, DL） ### AI、ML、DL 的區別 **人工智慧（Artificial Intelligence, AI）** 廣義概念，指電腦能展現出類似人類智慧的行為（推理、決策、預測）。 **機器學習（Machine Learning, ML）** AI 的一個子集，透過資料與經驗讓系統「學習」，不必完全依靠人工寫死規則。 **深度學習（Deep Learning, DL）** ML 的一個子集，利用人工神經網路（Artificial Neural Networks, ANN）的多層結構來解決更複雜問題。圖像關係：AI > ML > DL（套娃式包含關係）。 ### 三種學習方式 **監督式學習（Supervised Learning）**：使用「標記過的資料」訓練模型。例：垃圾郵件分類（輸入 = 郵件，標籤 = 垃圾/正常）。 **非監督式學習（Unsupervised Learning）**：沒有標記的資料，系統自己找規律與分群。例：顧客分群、購物行為模式。 **強化學習（Reinforcement Learning, RL）**：Trial & Error（試誤學習），透過「獎勵與懲罰」學最佳策略。例：AlphaGo 下棋、自駕車學習路徑。 ### 機器學習的經典方法 **決策樹（Decision Tree）**：像問答流程圖，逐步判斷。 **線性迴歸（Linear Regression）**：用一條直線來預測數值（如房價）。 **邏輯迴歸（Logistic Regression）**：預測二元結果（是/否、1/0），如判斷是否會貸款違約。 ### 神經網路（Neural Networks）靈感：模仿人腦的神經元（Neurons）。 **基本單元：感知器（Perceptron）** **輸入層** → 接收資料 **加權和（Weighted Sum）** → 計算影響力 **激活函數（Activation Function）** → 決定是否傳遞訊號 **輸出層** → 給出預測結果 ### 機器學習的 Trial-and-Error 過程就像人類學習 → 一開始會做錯，但系統會根據**反饋（Feedback）**逐步修正。強化學習（Reinforcement Learning）正是基於這種方式：不斷嘗試 → 根據獎勵改進 → 越來越好。 ### 深度學習（Deep Learning, DL）定義：一種 ML，使用多層神經網路（Multilayer Perceptrons, MLPs）處理複雜數據。生態系統（Ecosystem）： ● 卷積神經網路（Convolutional Neural Network, CNN）→ 影像辨識 ● 循環神經網路（Recurrent Neural Network, RNN）→ 語音/文字 ● 生成對抗網路（Generative Adversarial Network, GAN）→ 影像生成 ● Transformer 模型（例如 GPT）→ 語言理解與生成 ## Chapter 4 Run AI Models with IBM Watson Studio ### **IBM Watson Studio是什麼？** → 一個**整合開發環境（Integrated Development Environment, IDE）**，專門用來構建與管理 AI / ML 專案。功能：構建、訓練、測試、管理機器學習模型（Machine Learning Models）目的：讓團隊能更快協作並開發 AI 解決方案輸出：結果可以存成工作模型或 Jupyter Notebook（.ipynb） ### Watson Studio 的特色與好處 **AutoAI**：自動嘗試多種演算法，選出最佳模型 **可視化介面**：不需要寫程式也能操作 **雲端儲存**：方便共享資料 **Notebook 支援**：進階使用者可用程式控制 ### 專案設置流程 **Provision Watson Studio**（開通服務） **建立新專案（New AI Project）與Cloud Object Storage** **匯入資料集（Dataset）** **建立模型（用 AutoAI）** ● 自動產生多個模型（決策樹、隨機森林、迴歸…） ● 訓練並比較 → 選出最佳模型 **運行 Prediction Experiment**（測試新資料的預測能力） **評估結果（Confusion Matrix）** **TP（真陽性）**：判斷對的「有」 **TN（真陰性）**：判斷對的「沒有」 **FP（偽陽性）**：誤報 **FN（偽陰性）**：漏判可計算 Accuracy、Precision、Recall、F1-score ### 總結： 1.Watson Studio = AI/ML 專案工作室 2.提供完整流程：資料 → 模型 → 預測 → 評估 → 儲存 3.AutoAI 幫助快速建模 4.混淆矩陣是評估模型準確性的工具 5.結果能存成 Notebook，靈活度高 ## Chapter 5 AI 倫理（AI Ethics） ### Five Pillars of AI Ethics 公平（Fairness）、穩健（Robustness）、可解釋性（Explainability）、透明度（Transparency）、隱私（Privacy） #### 公平（Fairness）定義：確保不同個體或群體獲得公平對待。目標：透過演算法設計與數據清理，減少不必要的偏差。 **Protected Attributes（受保護屬性）**：區分族群的特徵，例如性別、種族、年齡。 **Privileged Groups（特權群體）**：傳統上獲得較多有利結果。 **Unprivileged Groups（弱勢群體）**：傳統上較少或無法獲得有利結果。 **Bias（偏差/偏見）**：一種系統性錯誤，可能導致不公平決策（無論是否故意）。 #### 穩健（Robustness）定義：AI 系統能應對異常情況或惡意攻擊，而不造成傷害。 **對抗性攻擊（Adversarial Attacks）**：故意利用 AI 系統漏洞，達到惡意目的。 **Poisoning（汙染攻擊）**：在訓練階段注入惡意數據，影響模型行為。 **Evasion（規避攻擊）**：在輸入中添加干擾，欺騙模型做錯誤判斷。 #### 可解釋性（Explainability）定義：一般人能理解 AI 系統為何做出某個預測或推薦。 **Interpretability（可解讀性）**：觀察者能理解某個決策的原因。 **Explainability（可解釋性）**：描述 AI 系統如何得到結果的過程。價值：提高信任度，方便檢查錯誤，協助符合法規。 #### 透明度（Transparency）定義：公開 AI 系統相關資訊例如：訓練資料來源、設計決策、模型建立與評估方法、部署流程 **治理（Governance）**：確保 AI 的開發與部署遵守內部政策與規範。 **涉及角色**：業務部門、人資、法務、開發團隊都可能參與透明度的治理。 #### 隱私（Privacy）定義：在使用個人或敏感資料訓練模型時，必須保護個人隱私。技術手段： **模型匿名化（Model Anonymization）**：移除或模糊化個人識別資訊。 **差分隱私（Differential Privacy）**：在數據中引入隨機噪聲，降低個人被識別的風險。 **資料最小化（Data Minimization）**：模型訓練後，僅保留必要的資料，刪除或壓縮其他資訊。 ### 總結：公平（Fairness） → 減少偏差，避免歧視。穩健（Robustness） → 防禦異常輸入與惡意攻擊。可解釋性（Explainability） → 讓人理解 AI 決策的理由。透明度（Transparency） → 開放資料來源、設計與治理流程。隱私（Privacy） → 使用技術手段保護個人與敏感資訊。