# Artificial Intelligence Fundamentals
因緣際會之下,我修了 IBM 提供的 Artificial Intelligence Fundamentals 課程。這是一門基礎 AI 知識的入門課,涵蓋了機器學習、自然語言處理等核心概念。雖然一開始只是想增廣見聞,但隨著課程推進,我逐漸體會到 AI 技術背後的邏輯與應用價值。最後,我也順利通過考核,獲得了官方證書!
這份筆記將記錄我的學習重點與心得,希望能成為日後複習的依據,也能和有興趣的朋友們分享。
## Chapter 1 Introduction to Artificial Intelligence
### 1. Artificial Intelligence 的定義
人工智慧(AI):指電腦或機器展現出類似人類的智慧行為,例如學習、推理、規劃、理解語言、做決策。
目的:讓機器能夠模仿甚至增強人類的思考過程。
### 2. AI 與 Augmented Intelligence 的差異
**Artificial Intelligence**:企圖讓機器自主完成任務,有時甚至超越人類能力。
**Augmented Intelligence**(增強智慧):不是取代人類,而是協助人類做出更好的決策。
例子:醫療診斷輔助系統 → 醫生依然是最終決策者。
### 3. 三個層級的人工智慧
**Narrow AI**:專注單一領域任務,例如語音助理、影像辨識。
**Broad AI**:能處理較廣範圍的相關任務,能整合到商業流程中。
**General AI**:理論上能做所有人類能做的智力工作,具備普遍推理能力,目前尚未實現。
### 4. AI 歷史
過去:1950s → AI 概念提出,象徵性推理、專家系統。
現在:以 機器學習、深度學習為核心,應用於醫療、金融、交通、娛樂。
未來:邁向 Broad AI甚至 General AI,與人類更緊密協作。
### 5. 機器學習(Machine Learning)
定義:一種 AI 方法,讓系統能從資料中學習模式,逐步改善表現,而不是僅靠人類寫死的程式規則。
核心:演算法 + 大量資料 + 訓練過程。
**三種資料型態**
**Structured data(結構化資料)**
固定格式,適合存放在資料庫。例:航班時刻表、交易紀錄。
**Semi-structured data(半結構化資料)**
部分結構化,使用 metadata 組織。例:XML、JSON。
**Unstructured data(非結構化資料)**
沒有固定格式,難以用傳統工具處理。例:文字、圖片、音訊、影片。
**如何結構化非結構化資料?**
ML 將非結構化資料轉換成特徵(features),再進行模型訓練。與傳統系統不同,ML 給出機率性判斷,而不是硬性的「是/否」答案。
**如何用機率計算解決問題?**
ML 演算法透過統計模型,輸出不同可能結果的機率。人類再依據這些機率與情境判斷做決策。🔹 例子:醫療診斷 → AI 提供 70% 可能是流感,25% 可能是 COVID,5% 可能是過敏。
### 6. 機器學習分析資料的三種方法
**Supervised learning(監督式學習)**:使用已標記的資料來訓練模型。
例:垃圾郵件分類。
**Unsupervised learning(非監督式學習)**:資料未標記,演算法自動找出群組或關聯。
例:顧客分群分析。
**Reinforcement learning(強化學習)**:透過 trial & error 以及獎勵機制學習最佳行為。
例:AI 下棋、機器人走迷宮。
### 7. 理想的人機關係
AI 與人類互補:AI 提供高速計算、模式辨識,人類提供經驗、倫理與價值判斷。
最佳情境:人類不是被 AI 取代,而是因為 AI 的幫助而做出更好、更快的決策。
## Chapter 2 Natural Language Processing and Computer Vision
### 自然語言處理(Natural Language Processing, NLP)的基礎
**定義**:讓電腦理解、解釋、生成自然語言的技術。
**語言特性**:非結構化(Unstructured Data),需轉換成結構化才能運算。
**處理流程**:Tokenization → 分類/排序 → 建立結構 → 提取意義。
**案例**:IBM Project Debater(學習 → 建立立場 → 組織證據 → 回應對手)。
### NLP 推導意義
Entities(實體):人、地點、物件(名詞)。
Relationships(關係):實體之間的連結。
Emotion Detection(情緒偵測):辨識情緒類型。
Sentiment Analysis(情感分析):判斷正面 / 負面 / 中立。
### 分類問題(Classification Problem)
定義:將資料分到特定類別。電腦要判斷「這個東西屬於哪一類?」
解法:
**決策樹(Decision Tree)**:透過一連串判斷,最後把資料分到一個類別。
**支持向量機(Support Vector Machine, SVM)**:把資料畫在平面或空間裡,用一條「最佳分隔線」把不同類別分開。
**人工神經網路(Artificial Neural Network, ANN)**:模仿人腦神經元,層層傳遞訊號,最後輸出結果。
### 聊天機器人(Chatbots)
運作方式:
前端(Frontend):與使用者互動。
後端(Backend):處理邏輯,記住對話。
核心元素:
Intent(意圖)→ 動詞,使用者需求。
Entity(實體)→ 名詞,相關資訊。
Dialog(對話流程)→ 對話回應路徑。
應用:FAQ、自動客服、預約/訂單系統。
NLP 實際應用:翻譯、情感分析、語音助理。
### 電腦視覺(Computer Vision, CV)
#### **影像分類**(Image Classification):辨識影像內容。
#### **卷積神經網路**(Convolutional Neural Network, CNN):
卷積層(Convolutional Layer) → 特徵擷取(邊緣、形狀)
池化層(Pooling Layer) 把圖片「壓縮」,只留下最重要的特徵 → 降低維度、壓縮資訊
全連接層(Fully Connected Layer) → 分類(把前面萃取的特徵綜合起來,最後輸出答案。)
CNN = 三步驟工作:卷積層:找細節(邊緣、形狀) → 池化層:縮圖、抓重點 → 全連接層:判斷結果(貓 or 狗)
#### **生成對抗網路**(Generative Adversarial Network, GAN):
**生成器(Generator)**:創造影像
負責「創造」影像,一開始會亂畫,但逐步學習如何畫得像真的。
**判別器(Discriminator)**:檢測真偽
負責「檢查」影像是真是假。它要分辨一張圖是人類拍的,還是生成器畫的。
**對抗訓練** → 生成逼真影像
生成器不斷嘗試欺騙判別器,判別器則不斷加強識破 → 最後生成器能畫出非常逼真的圖。
**應用**:醫療影像診斷、自駕車、人臉辨識、Deepfake/AI 藝術。
## Chapter 3 機器學習(Machine Learning, ML)與深度學習(Deep Learning, DL)
### AI、ML、DL 的區別
**人工智慧(Artificial Intelligence, AI)**
廣義概念,指電腦能展現出類似人類智慧的行為(推理、決策、預測)。
**機器學習(Machine Learning, ML)**
AI 的一個子集,透過資料與經驗讓系統「學習」,不必完全依靠人工寫死規則。
**深度學習(Deep Learning, DL)**
ML 的一個子集,利用人工神經網路(Artificial Neural Networks, ANN) 的多層結構來解決更複雜問題。
圖像關係:AI > ML > DL(套娃式包含關係)。
### 三種學習方式
**監督式學習(Supervised Learning)**:使用「標記過的資料」訓練模型。
例:垃圾郵件分類(輸入 = 郵件,標籤 = 垃圾/正常)。
**非監督式學習(Unsupervised Learning)**:沒有標記的資料,系統自己找規律與分群。
例:顧客分群、購物行為模式。
**強化學習(Reinforcement Learning, RL)**:Trial & Error(試誤學習),透過「獎勵與懲罰」學最佳策略。
例:AlphaGo 下棋、自駕車學習路徑。
### 機器學習的經典方法
**決策樹(Decision Tree)**:像問答流程圖,逐步判斷。
**線性迴歸(Linear Regression)**:用一條直線來預測數值(如房價)。
**邏輯迴歸(Logistic Regression)**:預測二元結果(是/否、1/0),如判斷是否會貸款違約。
### 神經網路(Neural Networks)
靈感:模仿人腦的神經元(Neurons)。
**基本單元:感知器(Perceptron)**
**輸入層** → 接收資料
**加權和(Weighted Sum)** → 計算影響力
**激活函數(Activation Function)** → 決定是否傳遞訊號
**輸出層** → 給出預測結果
### 機器學習的 Trial-and-Error 過程
就像人類學習 → 一開始會做錯,但系統會根據**反饋(Feedback)**逐步修正。
強化學習(Reinforcement Learning)正是基於這種方式:不斷嘗試 → 根據獎勵改進 → 越來越好。
### 深度學習(Deep Learning, DL)
定義:一種 ML,使用多層神經網路(Multilayer Perceptrons, MLPs)處理複雜數據。
生態系統(Ecosystem):
● 卷積神經網路(Convolutional Neural Network, CNN)→ 影像辨識
● 循環神經網路(Recurrent Neural Network, RNN)→ 語音/文字
● 生成對抗網路(Generative Adversarial Network, GAN)→ 影像生成
● Transformer 模型(例如 GPT)→ 語言理解與生成
## Chapter 4 Run AI Models with IBM Watson Studio
### **IBM Watson Studio是什麼?**
→ 一個**整合開發環境(Integrated Development Environment, IDE)**,專門用來構建與管理 AI / ML 專案。
功能:構建、訓練、測試、管理 機器學習模型(Machine Learning Models)
目的:讓團隊能更快協作並開發 AI 解決方案
輸出:結果可以存成 工作模型 或 Jupyter Notebook(.ipynb)
### Watson Studio 的特色與好處
**AutoAI**:自動嘗試多種演算法,選出最佳模型
**可視化介面**:不需要寫程式也能操作
**雲端儲存**:方便共享資料
**Notebook 支援**:進階使用者可用程式控制
### 專案設置流程
**Provision Watson Studio**(開通服務)
**建立新專案(New AI Project)與Cloud Object Storage**
**匯入資料集(Dataset)**
**建立模型(用 AutoAI)**
● 自動產生多個模型(決策樹、隨機森林、迴歸…)
● 訓練並比較 → 選出最佳模型
**運行 Prediction Experiment**(測試新資料的預測能力)
**評估結果(Confusion Matrix)**
**TP(真陽性)**:判斷對的「有」
**TN(真陰性)**:判斷對的「沒有」
**FP(偽陽性)**:誤報
**FN(偽陰性)**:漏判
可計算 Accuracy、Precision、Recall、F1-score
### 總結:
1.Watson Studio = AI/ML 專案工作室
2.提供完整流程:資料 → 模型 → 預測 → 評估 → 儲存
3.AutoAI 幫助快速建模
4.混淆矩陣是評估模型準確性的工具
5.結果能存成 Notebook,靈活度高
## Chapter 5 AI 倫理(AI Ethics)
### Five Pillars of AI Ethics
公平(Fairness)、穩健(Robustness)、可解釋性(Explainability)、透明度(Transparency)、隱私(Privacy)
#### 公平(Fairness)
定義:確保不同個體或群體獲得公平對待。
目標:透過演算法設計與數據清理,減少不必要的偏差。
**Protected Attributes(受保護屬性)**:區分族群的特徵,例如性別、種族、年齡。
**Privileged Groups(特權群體)**:傳統上獲得較多有利結果。
**Unprivileged Groups(弱勢群體)**:傳統上較少或無法獲得有利結果。
**Bias(偏差/偏見)**:一種系統性錯誤,可能導致不公平決策(無論是否故意)。
#### 穩健(Robustness)
定義:AI 系統能應對異常情況或惡意攻擊,而不造成傷害。
**對抗性攻擊(Adversarial Attacks)**:故意利用 AI 系統漏洞,達到惡意目的。
**Poisoning(汙染攻擊)**:在訓練階段注入惡意數據,影響模型行為。
**Evasion(規避攻擊)**:在輸入中添加干擾,欺騙模型做錯誤判斷。
#### 可解釋性(Explainability)
定義:一般人能理解 AI 系統為何做出某個預測或推薦。
**Interpretability(可解讀性)**:觀察者能理解某個決策的原因。
**Explainability(可解釋性)**:描述 AI 系統如何得到結果的過程。
價值:提高信任度,方便檢查錯誤,協助符合法規。
#### 透明度(Transparency)
定義:公開 AI 系統相關資訊
例如:訓練資料來源、設計決策、模型建立與評估方法、部署流程
**治理(Governance)**:確保 AI 的開發與部署遵守內部政策與規範。
**涉及角色**:業務部門、人資、法務、開發團隊都可能參與透明度的治理。
#### 隱私(Privacy)
定義:在使用個人或敏感資料訓練模型時,必須保護個人隱私。
技術手段:
**模型匿名化(Model Anonymization)**:移除或模糊化個人識別資訊。
**差分隱私(Differential Privacy)**:在數據中引入隨機噪聲,降低個人被識別的風險。
**資料最小化(Data Minimization)**:模型訓練後,僅保留必要的資料,刪除或壓縮其他資訊。
### 總結:
公平(Fairness) → 減少偏差,避免歧視。
穩健(Robustness) → 防禦異常輸入與惡意攻擊。
可解釋性(Explainability) → 讓人理解 AI 決策的理由。
透明度(Transparency) → 開放資料來源、設計與治理流程。
隱私(Privacy) → 使用技術手段保護個人與敏感資訊。