# 【生成式AI導論 2024】第1講:生成式AI是什麼? ## 人工智慧(AI, Artificial Intelligence)是什麼? * 人工智慧是機器所展現的智慧,但「智慧」本身沒有明確定義。 * 每個人對 AI 的想像不同,導致「人工智慧」這個詞無法嚴格定義。 * AI 是一個目標,而不是一種技術,這個目標是讓機器展現人類智慧般的能力。 ### 生成式人工智慧(Generative AI)是什麼? * 定義明確:讓機器「產生複雜且有結構的內容」。 * 這些內容可能是: * 📄 文章(文字序列) * 🖼️ 圖像(像素陣列) * 🔊 聲音(時間序列取樣點) * 「複雜且有結構」=人類無法用窮舉的方式列出所有可能。 * 例:100字文章的可能組合為 10^300,遠大於宇宙中的原子數 10^80 ### 與生成式 AI 不同的任務:分類(Classification) * 例子: * 垃圾郵件判斷(是/否) * 圖片分類(貓/狗) * 特徵:從有限選項中選擇答案,不需要生成新內容 → 不屬於生成式 AI ## 機器學習(Machine Learning)是什麼? * 核心任務:從資料中自動找出函數關係(學習過程 = 找參數) * 國中數學比喻: * 給定: * f(x)=ax+b,找出 a、b → 即「找出參數」 * 更複雜任務:如圖片分類,模型(函數)可能包含上萬個參數 * 有大量未知參數的函式 → 稱為模型(Model) ### 訓練(Training)與推論(Inference) * 訓練資料(Training Data):輸入/輸出對照,幫助找出模型參數 * 推論/測試(Inference / Testing):輸入新資料 → 用模型產生輸出 ## 深度學習(Deep Learning) * 是機器學習的一種,使用「類神經網路(Neural Network)」表示模型 * 神經網路=一個擁有大量參數的函數 * 常見誤會:「模仿人腦」的說法只是比喻,實際只是複雜的數學函式 ## GPT 的核心概念:文字接龍(Language Modeling) * ChatGPT 的生成方式 = 逐字預測 → 文字接龍 * 輸入:「台灣最高的山是哪座?」 * 預測:接「玉」合理 → 接「山」→ 停止(得出「玉山」) * 將「生成文章」轉為一系列「選擇下一個字」的分類問題 → 讓「無限可能」問題 → 轉為「有限選項」分類問題 → 可解! ## 自回歸生成(Autoregressive Generation) * 將輸出物件(如文字、影像)拆成一連串小單位,按順序產生 * 例子: * 文字:字、詞、token 一個接一個產生 * 圖像:像素一個接一個產生(但效果差,後來捨棄) * ChatGPT 使用的 Transformer 就是這種模型架構的代表 ## 生成式 AI 的歷史與演進 * 早期就存在,例如: * Google 翻譯(2006 上線):就是一種文字生成 * 為什麼現在爆紅? * 技術演進:Transformer 等模型出現 * 資料與算力大幅成長 → 支撐訓練超大型模型(上億參數) * 效果接近人類 → 讓生成式 AI 進入主流 ## 獵人梗:生成式 AI = 暗黑大陸 * 過去分類任務=已知世界 * 生成任務=未知領域(暗黑大陸) * 現在我們已經站在暗黑大陸的門口,見到守門人(如 ChatGPT)