# 1 - 人工智慧基礎概論 1. 關於AI,下列敘述何者最為正確? (A) AI僅能處理結構化數據的分析。 (B) AI涵蓋多種專業領域與技術,旨在執行通常需要人類智慧的任務。 (C) AI系統只能在學術研究中應用,不適用於商業。 (D) AI無法應用於金融、醫療等高風險領域。 :::spoiler **答案** B ::: 2. 下列何者最能代表「弱人工智慧 (Weak AI)」的特性? (A) 具備完整的人類認知能力,能夠像人類一樣學習、理解和創造新知識。 (B) 主要處理特定問題,不需要具備完整的人類感官認知能力。 (C) AlphaGo是弱人工智慧的典型範例。 (D) 能自行校正並持續進化,達成通用型人工智慧。 :::spoiler **答案** B ::: 3. 英國數學家艾倫.圖靈在1950年提出的「圖靈測試」旨在評估AI的何種能力? (A) 視覺感知能力。 (B) 語音辨識能力。 (C) 機器能否透過文字對話,使人類測試員無法分辨其與人對話的差異。 (D) 在複雜遊戲中擊敗人類對手的能力。 :::spoiler **答案** C ::: 4. 機器學習 (Machine Learning) 作為人工智慧的一部分,其主要目的為何? (A) 使電腦能夠模擬人類思考模式,並進行人機對話。 (B) 透過特殊演算法,讓電腦從大量數據中找出規律性並產生模型,進而進行預測。 (C) 讓電腦能看見、理解並解釋視覺資訊。 (D) 讓電腦能夠理解、解釋和生成人類語言。 :::spoiler **答案** B ::: 5. 在機器學習中,訓練電腦下圍棋、自動駕駛等動態重複地互動問題,最適合採用下列哪一種學習方式? (A) 監督式學習 (Supervised Learning)。 (B) 非監督式學習 (Unsupervised Learning)。 (C) 半監督式學習 (Semi-supervised Learning)。 (D) 強化學習 (Reinforcement Learning)。 :::spoiler **答案** D ### (A) 監督式學習 (Supervised Learning) **是什麼?** 監督式學習的核心是從**有標籤的數據**中學習。這表示在訓練時,每個輸入樣本都會提供其正確的答案(標籤)。模型會學習如何將輸入對應到正確的輸出,並依此進行**預測**。 **適合用在哪?** * **分類 (Classification)**:當你需要將數據分成不同的類別時,例如: * 判斷郵件是不是**垃圾郵件**。 * 辨識圖片中是**貓**、**狗**還是**鳥**。 * **迴歸 (Regression)**:當你需要預測一個連續的數值時,例如: * 根據房屋大小和地點**預測房價**。 * 預測**股票價格**。 **為什麼不適用下圍棋或自動駕駛?** 像下圍棋或自動駕駛這類問題,其決策情境極為複雜且變數眾多,幾乎不可能預先窮舉並標記所有可能情況的「正確」行動。這些都是動態且高度互動的問題,需要模型能夠在未知情境中自主探索並學習最佳策略,而非僅僅模仿已標記的歷史數據。 --- ### (B) 非監督式學習 (Unsupervised Learning) **是什麼?** 非監督式學習處理的是**沒有標籤的數據**。它的主要目標是從數據中找出隱藏的模式、結構或群組,讓模型自行發現數據之間的關聯。 **適合用在哪?** * **聚類 (Clustering)**:將相似的數據點自動歸類分組,例如: * 依據購買行為將**客戶分群**。 * 對文章進行**主題分類**。 * **降維 (Dimensionality Reduction)**:減少數據的複雜度,同時保留關鍵資訊,例如: * **圖片壓縮**。 * **異常偵測 (Anomaly Detection)**:從數據中找出不尋常的模式或離群值,例如: * **信用卡詐欺偵測**。 **為什麼不適用下圍棋或自動駕駛?** 非監督式學習無法直接學習如何執行特定任務或做出決策。它主要聚焦於數據分析和模式發現,而不是學習一套能在動態環境中引導行為的策略。下圍棋或自動駕駛需要的是明確的行動選擇和達成目標的過程。 --- ### (C) 半監督式學習 (Semi-supervised Learning) **是什麼?** 半監督式學習結合了監督式和非監督式學習的特點。它利用**少量有標籤的數據**和**大量沒有標籤的數據**來進行訓練。通常,模型會先從未標記的數據中學習其整體結構,再利用這些結構來強化從有限標記數據中學到的知識。 **適合用在哪?** * 當**標籤數據獲取成本很高**,但**未標記數據卻很豐富**時,例如: * 某些需要專家判斷的**醫學影像分類**。 * **網頁文本分類**。 **為什麼不適用下圍棋或自動駕駛?** 儘管半監督式學習有助於緩解標記數據不足的問題,但它仍無法根本解決下圍棋或自動駕駛這類問題的挑戰。這些問題的核心在於無限或極大的狀態空間中,需要透過**與環境互動**來學習一系列**最佳決策**。半監督式學習缺乏強化學習那種直接且高效的機制來處理這種序列性決策和行為優化。 ::: 6. 若要設計一個能夠辨識並過濾垃圾郵件的系統,根據其學習特點,最適合選擇下列哪一種機器學習演算法? (A) 監督式學習 (Supervised Learning)。 (B) 非監督式學習 (Unsupervised Learning)。 (C) 半監督式學習 (Semi-supervised Learning)。 (D) 強化學習 (Reinforcement Learning)。 :::spoiler **答案** A ::: 7. 下列何者「非」大數據時代資料的特性? (A) 資料量大 (Volume)。 (B) 資料變動速度快 (Velocity)。 (C) 資料多樣性 (Variety)。 (D) 資料存儲位置固定。 :::spoiler **答案** D ::: 8. 員工年齡、員工年資、貨品銷售量等資料,最常用下列哪一種資料型態儲存? (A) 文字型 (Text)。 (B) 數值型 (Numeric)。 (C) 日期型 (Date)。 (D) 布林型 (Boolean)。 :::spoiler **答案** B ::: 9. 下列哪一種資料類型不屬於非結構化資料? (A) X 光醫學影像。 (B) 監控錄影畫面。 (C) 客服電話錄音。 (D) 組織內部的關係型資料庫記錄。 :::spoiler **答案** D ::: 10. 在AI與大數據的關係中,資料處理與分析的正確流程排序為何? (A) 資料前處理 -> 資料收集 -> 資料分析 -> 資料解釋 -> 決策應用。 (B) 資料分析 -> 資料解釋 -> 資料收集 -> 資料前處理 -> 決策應用。 (C) 資料收集 -> 資料前處理 -> 資料分析 -> 資料解釋 -> 決策應用。 (D) 資料解釋 -> 資料分析 -> 資料前處理 -> 資料收集 -> 決策應用。 :::spoiler **答案** C ::: 11. 在檢視資料品質時,可參考資料的變異程度及資料的集中趨勢。下列何者不屬於資料集中趨勢衡量的方法? (A) 平均數 (Mean)。 (B) 中位數 (Median)。 (C) 眾數 (Mode)。 (D) 標準差 (Standard Deviation)。 :::spoiler **答案** D 為什麼是 (D) 標準差? 集中趨勢 (Measures of Central Tendency):這些方法旨在找出資料集的「中心」或「代表值」。它們告訴我們資料點傾向於聚集在哪裡。 (A) 平均數 (Mean):所有數據點的總和除以數據點的數量。它是最常見的集中趨勢量度。 (B) 中位數 (Median):將數據從小到大排列後,位於最中間的那個數值。如果數據點是偶數,則取中間兩個數的平均值。它不受極端值的影響。 (C) 眾數 (Mode):數據集中出現次數最多的數值。一個數據集可能有一個眾數、多個眾數或沒有眾數。 變異程度 (Measures of Variability / Dispersion):這些方法則描述了資料點的分散程度或波動範圍,而不是它們的中心位置。 (D) 標準差 (Standard Deviation):衡量數據點平均偏離平均數的程度。標準差越大,表示數據點越分散;標準差越小,表示數據點越集中。它是一個反映資料變異程度的重要指標,而非集中趨勢。 ::: 12. 某醫院研究特定心血管疾病的成因,收集了50名病患與150名正常人的年齡、血壓、血型等三項屬性變數。此研究適合使用下列哪一種機器學習模型來建立? (A) 決策樹 (Decision Tree)。 (B) 線性迴歸 (Linear Regression)。 (C) 基於密度之含噪空間聚類法 (DBSCAN)。 (D) K-means 聚類 (K-means Clustering)。 :::spoiler **答案** A 為什麼是 (A) 決策樹? 此研究的目標是根據病患與正常人的屬性(年齡、血壓、血型)來建立模型,以識別或區分這兩類人群,並進一步探討疾病成因。這是一個典型的二元分類問題,因為數據已經有明確的類別標籤:「病患」和「正常人」。 讓我們分析各選項: (A) 決策樹 (Decision Tree): 屬性: 決策樹是一種監督式學習演算法,可用於分類和迴歸問題。它透過建立一系列的決策規則來將資料分類。對於本研究,決策樹可以學習如何根據年齡、血壓、血型等屬性,將一個人判斷為「病患」或「正常人」,並可能揭示哪些屬性是區分這兩組的關鍵因素。 適用性: 非常適合此分類問題。 (B) 線性迴歸 (Linear Regression): 屬性: 線性迴歸是一種監督式學習演算法,專門用於迴歸問題,即預測一個連續的數值型目標變數。 不適用性: 本研究的目標是分類(病患/正常人),而不是預測一個連續數值,因此線性迴歸不適合。 (C) 基於密度之含噪空間聚類法 (DBSCAN): 屬性: DBSCAN 是一種非監督式學習的聚類演算法。它的目的是在沒有預先標籤的情況下,根據數據點的密度將其分組(聚類),並能識別噪音點。 不適用性: 本研究的數據已經有明確的類別標籤(病患/正常人),這是一個有監督的分類問題,而不是尋找未知的數據分組。 (D) K-means 聚類 (K-means Clustering): 屬性: K-means 也是一種非監督式學習的聚類演算法。它將數據劃分為預設數量的 K 個群集,目標是使每個群集內的數據點盡可能相似。 不適用性: 與 DBSCAN 相同,K-means 用於無監督的聚類,而本研究是監督式分類問題。 綜上所述,由於研究目標是基於已標籤的資料(病患與正常人)來建立模型以理解疾病成因,這是一個分類任務,因此決策樹是最合適的選擇。 ::: 13. 線性迴歸模型最適合解決哪種類型的問題? (A) 圖像分類。 (B) 銷售額預測。 (C) 聚類分析。 (D) 遊戲策略學習。 :::spoiler **答案** B ::: 14. 神經網路與傳統機器學習模型的主要區別是什麼? (A) 神經網路無法處理非線性數據。 (B) 神經網路透過多層結構學習複雜特徵。 (C) 神經網路只適用於迴歸問題。 (D) 神經網路不需要大量數據支持。 :::spoiler **答案** B ::: 15. 在深度學習模型中,下列哪一項通常用來降低過擬合 (Overfitting) 問題? (A) 增加訓練數據量。 (B) 增加模型的複雜度。 (C) 增加學習率。 (D) 增加正則化項。 :::spoiler **答案** D 選項分析 (A) 增加訓練數據量 (Increase Training Data) 作用: 這是一個非常有效的降低過擬合的方法。更多的訓練數據可以幫助模型學習到更普遍的規律,減少對訓練數據中特定噪音的依賴,從而提高模型的泛化能力。 為什麼不是最佳答案 (在單選題中)? 雖然增加訓練數據量非常有效,但在選項給定選擇的情況下,如果數據量受限,則需要其他技術。在單選題中,通常會選擇一個直接作用於模型訓練過程本身的技巧。 (B) 增加模型的複雜度 (Increase Model Complexity) 作用: 增加模型的複雜度(例如,增加神經網路的層數或每層的神經元數量)通常會加劇過擬合問題,而不是降低它。更複雜的模型有更強大的學習能力,更容易記憶訓練數據的細節和噪音。 不適用性: 這與降低過擬合的目標背道而馳。 (C) 增加學習率 (Increase Learning Rate) 作用: 學習率是優化演算法(如梯度下降)中的一個超參數,它決定了模型在每次迭代中更新權重的步長。 不適用性: 增加學習率可能會導致模型訓練不穩定,甚至無法收斂,或跳過最佳解,與直接解決過擬合問題的關係不大。雖然過高的學習率可能導致模型無法很好地擬合訓練數據(欠擬合),但它並非降低過擬合的常用策略。 (D) 增加正則化項 (Increase Regularization Term) 作用: 這是深度學習中降低過擬合的常用且直接有效的方法之一。 正則化(例如 L1 或 L2 正則化)透過在模型的損失函數中添加一個懲罰項來約束模型的複雜度。它會迫使模型在訓練過程中,不僅要最小化預測誤差,還要使模型的權重保持較小或稀疏,從而避免模型過度依賴任何單一特徵,減少其對訓練數據的「記憶能力」。 適用性: 正則化項的引入就是為了限制模型自由度,使其更具泛化能力,從而有效對抗過擬合。 綜合來看,雖然增加訓練數據量也是對抗過擬合的有效手段,但「增加正則化項」是直接透過調整模型訓練過程來降低模型複雜度、提高泛化能力的一種機制,通常在模型設計和優化時直接應用來解決過擬合問題。 ::: 16. 關於生成式 AI 的基本原理,下列敘述何者較為正確? (A) 生成式 AI 通過分析大量數據來生成新數據,模擬數據分佈以創造與訓練數據相似的結果。 (B) 生成式 AI 主要通過預定義的規則來進行數據處理和分類。 (C) 生成式 AI 專注於數據分類和迴歸預測,幫助識別已知數據中的模式。 (D) 生成式 AI 通過自動化的方式清洗數據,提升數據分析的準確性。 :::spoiler **答案** A 生成式 AI 的核心原理 生成式 AI (Generative AI) 的核心目標是「創造」或「生成」全新的內容,這些內容在統計特性上與其訓練數據相似,但並非訓練數據的簡單複製。 選項分析 (A) 生成式 AI 通過分析大量數據來生成新數據,模擬數據分佈以創造與訓練數據相似的結果。 正確性: 這完美描述了生成式 AI 的基本原理。 生成模型會學習輸入數據的底層分佈模式,然後利用這個學到的分佈來產生新的、以前從未見過但符合該分佈的數據(例如,生成新的圖片、文章、音訊等)。它不是簡單地複製現有數據,而是從學到的「知識」中創造。 (B) 生成式 AI 主要通過預定義的規則來進行數據處理和分類。 不正確: 預定義的規則通常是傳統程式設計或一些早期 AI 系統的特點。生成式 AI 透過從數據中學習來生成內容,而不是遵循程式設計師明確設定的規則。它更強調彈性和創造性。 (C) 生成式 AI 專注於數據分類和迴歸預測,幫助識別已知數據中的模式。 不正確: 數據分類和迴歸預測是判別式 AI (Discriminative AI) 或監督式學習 (Supervised Learning) 的主要任務。判別式模型(如分類器)旨在區分不同類別或預測數值,它們識別的是數據中的模式以做出決策,而不是生成新數據。 (D) 生成式 AI 通過自動化的方式清洗數據,提升數據分析的準確性。 不正確: 數據清洗是數據預處理的一部分,目的是提高數據品質,與生成新數據的核心功能無關。雖然生成式模型可能需要高品質的訓練數據,但數據清洗本身不是其主要任務或基本原理。 ::: 17. 下列關於生成對抗網路 (GAN) 的描述,哪一項是正確的? (A) GAN 由生成器和鑑別器組成。 (B) GAN 僅用於分類問題。 (C) GAN 的結果始終高度可解釋。 (D) GAN 不能生成高品質的數據。 :::spoiler **答案** A 生成對抗網路 (GAN) 的核心概念 生成對抗網路 (Generative Adversarial Network, GAN) 是一種強大的生成式模型,它透過兩個神經網路的「對抗」過程來學習生成新的數據。 選項分析 (A) GAN 由生成器和鑑別器組成。 正確性: 這是 GAN 最基本的架構特徵。 生成器 (Generator, G):負責學習真實數據的分佈,並生成看起來像真實數據的假數據。它的目標是欺騙鑑別器。 鑑別器 (Discriminator, D):負責判斷輸入的數據是真實數據還是生成器生成的假數據。它的目標是正確區分真假。 這兩個網路在訓練過程中相互競爭、共同進步,形成一種「迷你最大博弈」(minimax game)。 (B) GAN 僅用於分類問題。 不正確: GAN 的主要用途是生成新的數據,而不是僅僅用於分類。雖然鑑別器在訓練過程中執行二元分類(判斷真假),但整個 GAN 的最終目標是生成器能夠生成高品質、逼真的數據。GAN 可以用於圖像生成、文本生成、音訊生成等,這些都不是傳統意義上的分類問題。 (C) GAN 的結果始終高度可解釋。 不正確: 深度學習模型,包括 GAN,通常被認為是「黑箱模型」。它們的內部運作機制和決策過程往往難以直接解釋。雖然研究人員正在努力提高其可解釋性,但「始終高度可解釋」的說法是不正確的。 (D) GAN 不能生成高品質的數據。 不正確: 這與事實完全相反。 GAN 以其能夠生成極其逼真和高品質的數據而聞名,尤其是在圖像生成領域,它能夠生成令人難以分辨真假的圖像。這是 GAN 最大的優勢和應用價值之一。 ::: 18. 在下列哪一種應用領域中,生成式 AI 最有可能被使用來創建新的圖像或影片內容? (A) 產品品質檢測。 (B) 醫學影像分析。 (C) 監控系統。 (D) 虛擬現實圖像。 :::spoiler **答案** D ::: 19. 下列哪項是生成式 AI 支援鑑別式 AI 的典型案例? (A) 模擬交通場景以訓練自動駕駛模型。 (B) 使用 CNN 對腫瘤分類。 (C) 使用 SVM 分析風險。 (D) 創建更好的分類演算法。 :::spoiler **答案** A 生成式 AI 如何支援鑑別式 AI 生成式 AI 的核心能力是創造新的、逼真的數據(例如圖像、文本、音訊等),這些數據與真實數據在統計特性上非常相似。 鑑別式 AI 的核心能力是區分數據類別或預測數值(例如圖像分類、風險分析、自然語言理解等)。 它需要大量標記數據來學習和做出準確判斷。 生成式 AI 支援鑑別式 AI 的典型方式就是數據增強或合成數據生成。當真實數據難以獲取、成本高昂或數量不足時,生成式 AI 可以產生逼真的合成數據,用來擴充訓練集,從而提升鑑別式 AI 模型的性能和泛化能力。 選項分析 (A) 模擬交通場景以訓練自動駕駛模型。 正確性: 自動駕駛模型(一個典型的鑑別式 AI 應用,需要識別路況、行人、車輛等)需要大量的訓練數據。然而,在現實世界中收集所有可能的危險或極端交通情境是極其困難和不安全的。生成式 AI 可以創建逼真的模擬交通場景(例如,不同天氣、光照、車輛行為等),這些合成數據可以用來訓練自動駕駛汽車的鑑別式模型,使其在部署前能學習應對各種複雜情況。 這完美符合生成式 AI 支援鑑別式 AI 的情境。 (B) 使用 CNN 對腫瘤分類。 不正確: CNN(卷積神經網路)本身是一種鑑別式模型,用於對圖像進行分類(如判斷腫瘤良惡性)。這個選項描述的是一個純粹的鑑別式任務,沒有體現生成式 AI 的作用。雖然生成式 AI 可以產生合成的腫瘤圖像來擴充訓練集,但選項本身並沒有提及這一點,只說明了 CNN 的應用。 (C) 使用 SVM 分析風險。 不正確: SVM(支持向量機)是一種鑑別式模型,常用於分類和迴歸任務,包括風險分析。這個選項描述的也是一個典型的鑑別式任務,與生成式 AI 的直接支援關係不大。 (D) 創建更好的分類演算法。 不正確: 這是一個非常籠統的說法。創建更好的演算法是一個演算法研究和開發的問題,不特指生成式 AI 如何支援現有的鑑別式 AI 模型。生成式 AI 旨在生成數據,而不是直接創造新的分類演算法。 ::: 20. 在AI治理中,下列何者是國際合作的重要性? (A) 統一 AI 發展標準。 (B) 避免 AI 技術的濫用。 (C) 促進 AI 技術的轉移。 (D) 以上皆是。 :::spoiler **答案** D ::: 21. 根據歐盟《人工智慧法》(Artificial Intelligence Act, AIA) 的風險分級,若某國考慮使用AI技術進行社會信用評分,並在公眾場所使用遠程生物辨識系統進行執法,這類應用屬於哪一風險等級? (A) 不可接受風險。 (B) 高風險。 (C) 有限風險。 (D) 小或低風險。 :::spoiler **答案** A ::: 22. 關於「負責任的 AI」,下列敘述何者較為正確? (A) AI系統的開發者對AI系統的行為負責。 (B) AI系統的使用者對AI系統的結果負責。 (C) AI系統本身對其行為負責。 (D) 政府對AI系統的發展負責。 :::spoiler **答案** A ::: 23. 在品質管理中,若一產品的生產過程中標準差顯著偏大,通常意味著什麼? (A) 資料點高度集中,產品質量穩定。 (B) 生產過程波動大,產品品質不穩定。 (C) 資料無法反映產品實際狀況。 (D) 中位數數值高,品質良率較高。 :::spoiler **答案** B ::: 24. 銀行想建立聊天機器人,可透過下列哪一種領域技術來達成? (A) 資料庫管理技術。 (B) 機器學習與自然語言處理。 (C) 網頁開發技術。 (D) 網路安全技術。 :::spoiler **答案** B ::: 25. 下列何者「不」是電腦視覺的核心技術之一? (A) 圖像處理。 (B) 特徵提取。 (C) 物件檢測。 (D) 資料加密。 :::spoiler **答案** D ::: 26. 在深度神經網路中,負責在不同層級處理資訊,並在接收新資訊時調整其行為,能夠從多個不同角度分析問題的層級是? (A) 輸入層。 (B) 隱藏層。 (C) 輸出層。 (D) 邏輯層。 :::spoiler **答案** B 深度神經網路的層級介紹 深度神經網路 (Deep Neural Network, DNN) 就像一個複雜的資訊處理工廠,資訊會經過好幾個階段的加工。它主要由三種類型的層構成: 1. 輸入層 (Input Layer): 這是神經網路的「入口」。 它的功能很單純,就是接收原始數據。例如,如果你輸入一張圖片,輸入層的每個節點可能就代表圖片的一個像素值。它不執行任何複雜的計算,只是將數據傳遞給下一層。 數量:通常只有一層。 2. 隱藏層 (Hidden Layers): 這是神經網路的「核心處理區」。在深度學習中,「深度」就體現在它擁有一個或多個隱藏層。 每個隱藏層的神經元會從前一層接收資訊,對其進行各種複雜的計算和轉換(例如,應用加權和、激活函數等)。 隨著資訊從一個隱藏層傳遞到下一個隱藏層,網路會逐步提取和學習數據中越來越抽象、複雜的特徵。例如,在圖片辨識中,第一層可能辨識邊緣,第二層辨識形狀,第三層辨識物體的局部特徵。 神經網路「學習」和「調整行為」的關鍵就在這些層,它們的權重和偏置會根據訓練數據不斷調整,以學習數據的深層模式,從而能夠從多個不同抽象層次來分析問題。 數量:可以有多層,這也是「深度」的來源。 3. 輸出層 (Output Layer): 這是神經網路的「出口」。 它負責將隱藏層處理後的資訊轉化為最終的輸出。這個輸出可以是分類結果(例如,判斷圖片是貓還是狗)、預測的數值(例如,房價)、或者其他模型的最終判斷。 數量:通常只有一層。 (D) 邏輯層 (Logical Layer): 這不是神經網路標準術語中用來描述其物理結構的層級。在某些抽象的討論中,它可能指處理邏輯的層次,但在深度神經網路的結構中,我們通常談論的是輸入層、隱藏層和輸出層。 ::: 27. 下列何者「不」是知識挖掘的應用領域? (A) 醫療。 (B) 金融。 (C) 製造。 (D) 即時互動式遊戲角色控制。 :::spoiler **答案** D ::: 28. 光學字元辨識 (OCR) 技術在鑑別式 AI 中的主要功能是什麼? (A) 根據文字描述生成新的圖像。 (B) 將掃描的文件或圖像中的文字轉換為可編輯的數位文本。 (C) 預測未來的市場趨勢。 (D) 對醫學影像進行分類以診斷疾病。 :::spoiler **答案** B ::: 29. 關於 AI 與大數據的關係,資料品質的重要性為何? (A) AI對資料品質的要求不高,因為它能自行處理雜訊。 (B) 資料品質對模型訓練的成效沒有直接影響。 (C) 高品質數據是成功AI應用的關鍵,包括數據清洗和標註。 (D) AI可以自動修復所有資料品質問題,因此資料前處理不是必要的。 :::spoiler **答案** C ::: 30. 下列哪一項是機器學習中「分類」(Classification/Categorization) 應用的一個例子? (A) 找出文件中自然的群組。 (B) 垃圾郵件過濾。 (C) 尋找資料間的線性或非線性關係。 (D) 預測房屋的價格。 :::spoiler **答案** B ::: # 2 - 產業常見的AI應用功能 1. 電腦視覺技術在製造業中的應用,下列敘述何者最為正確? (A) 僅限於人臉識別,無法進行產品品質檢測。 (B) 可用於產品品質檢測、設備監控及生產線優化。 (C) 主要功能是生成新的設計圖,不涉及現有產品分析。 (D) 只能在實驗室環境中使用,不適用於實際生產線。 :::spoiler **答案** B ::: 2. 在自然語言處理(NLP)應用中,下列哪一項技術最能幫助客服系統自動回答客戶問題,並提高服務效率? (A) 電腦視覺。 (B) 語音辨識。 (C) 智慧客服與自動回覆。 (D) 機器翻譯。 :::spoiler **答案** C ::: 3. 下列何者「不是」知識挖掘的主要應用領域? (A) 醫療。 (B) 金融。 (C) 氣象預測。 (D) 即時互動式遊戲角色控制。 :::spoiler **答案** D ::: 4. 光學字元辨識(OCR)技術在智慧文件處理中的主要功能是什麼? (A) 自動生成新的法律文件。 (B) 將掃描的文件或圖像中的文字轉換為可編輯的數位文本。 (C) 預測未來的市場趨勢。 (D) 對醫學影像進行分類以診斷疾病。 :::spoiler **答案** B ::: 5. 生成式 AI 在藝術設計領域的應用,下列敘述何者最為正確? (A) 僅限於將現有圖片放大縮小。 (B) 可用於圖像生成和風格轉換。 (C) 專門用於分析藝術品的歷史背景。 (D) 無法創作新的藝術作品,只能複製現有的。 :::spoiler **答案** B ::: 6. 在電腦視覺的核心技術中,用於從圖像中提取關鍵特徵(如邊緣、角點)的技術稱為? (A) 圖像處理。 (B) 特徵提取。 (C) 物件檢測。 (D) 圖像分類。 :::spoiler **答案** B ::: 7. 下列哪種自然語言處理(NLP)核心技術,旨在理解文本的語義,並應用於情感分析、主題識別和問答系統? (A) 語音識別。 (B) 自然語言生成。 (C) 語義分析。 (D) 機器翻譯。 :::spoiler **答案** C ::: 8. 知識挖掘的應用範例中,從銷售數據中發現消費趨勢,並幫助企業制定行銷策略,屬於哪一項應用? (A) 醫療病歷分析。 (B) 金融風險管理。 (C) 市場趨勢分析。 (D) 物流運輸優化。 :::spoiler **答案** C ::: 9. 智慧文件處理的應用場景中,若要自動化處理客戶提交的手寫或印刷表單,並提高效率,最適合使用哪種核心技術? (A) RPA(機器流程自動化)。 (B) 機器學習。 (C) 光學字元辨識(OCR)。 (D) 自然語言處理(NLP)。 :::spoiler **答案** C ::: 10. 下列哪一項是生成式AI在遊戲開發中的應用案例? (A) 自動化遊戲測試。 (B) 生成遊戲場景、角色和故事情節。 (C) 監控遊戲玩家的行為。 (D) 遊戲數據分析,優化遊戲平衡。 :::spoiler **答案** B ::: 11. 在電腦視覺中,卷積神經網路(CNN)的主要功能是什麼? (A) 僅用於圖像的壓縮和解壓縮。 (B) 透過篩選器提取圖像特徵並進行標籤預測。 (C) 專門用於聲音辨識,與圖像無關。 (D) 只能處理單色圖像,無法處理彩色圖像。 :::spoiler **答案** B 選項分析 (A) 僅用於圖像的壓縮和解壓縮。 不正確。 雖然某些神經網路架構(例如自編碼器)可以用於圖像壓縮,但這不是 CNN 的主要或唯一功能。CNN 更廣泛且核心的應用是理解圖像內容。 (B) 透過篩選器提取圖像特徵並進行標籤預測。 正確。 這是對 CNN 功能最精確的描述。 篩選器(或稱卷積核/濾波器) 是 CNN 的核心組件。它們在圖像上滑動,檢測並提取不同層次的特徵,例如邊緣、紋理、形狀等。 CNN 通常包含多個卷積層,每一層學習提取更複雜、更抽象的特徵。 提取這些特徵後,網路的後續層(通常是全連接層)會利用這些特徵進行標籤預測,例如將圖像分類為「貓」、「狗」或「車輛」,或在圖像中定位物體。 (C) 專門用於聲音辨識,與圖像無關。 不正確。 CNN 最初且主要是在圖像處理領域取得巨大成功。儘管其概念(如卷積操作)可以推廣到處理其他序列數據(如聲音),但說它「專門用於聲音辨識」且「與圖像無關」是錯誤的。在聲音處理中,音訊通常會轉換成頻譜圖(一種圖像表示)後再輸入 CNN 進行處理。 (D) 只能處理單色圖像,無法處理彩色圖像。 不正確。 CNN 完全能夠處理彩色圖像。彩色圖像通常有三個通道(紅、綠、藍,即 RGB),CNN 可以透過將卷積核應用於所有通道或為每個通道使用單獨的卷積核來處理這些多通道數據。 ::: 12. Microsoft Florence作為一個先進的多模態模型,其訓練方式是使用大量帶有何種數據進行? (A) 純文字數據。 (B) 純圖像數據。 (C) 帶有描述性文本的圖像數據。 (D) 僅限於音訊數據. :::spoiler **答案** C Microsoft Florence 介紹 Microsoft Florence 是一個由微軟開發的基礎模型 (Foundation Model),專注於電腦視覺領域。它的目標是建立一個能夠理解和處理各種視覺任務的通用模型,其命名靈感來自於現代護理學的創始人南丁格爾 (Florence Nightingale),寓意著它能像護士一樣,在各種視覺任務中提供「護理」和幫助。 Florence 的核心特點是它是一個多模態模型 (Multimodal Model),這意味著它不僅僅處理單一類型的數據,而是能夠同時理解和處理多種模態的數據。在 Florence 的情況下,最主要的兩種模態是圖像和文本。 Florence 的訓練方式與核心原理 Florence 的訓練方式是利用大規模的圖像-文本對數據集。這表示它的訓練數據不僅僅是單純的圖像,也不是單純的文字,而是圖像與其對應的文字描述(例如,一張狗的圖片會配上「一隻在草地上奔跑的棕色狗」這樣的文字描述)。 透過這種訓練方式,Florence 學習到: 圖像內容的語義理解: 它能夠理解圖像中包含了什麼物體、場景、動作等。 圖像與文本之間的關聯: 它學會了如何將視覺概念與語言描述聯繫起來。這使得模型能夠執行許多跨模態的任務。 選項分析 (A) 純文字數據。 不正確。 純文字數據主要用於訓練大型語言模型 (LLM),例如 GPT 系列。Florence 作為視覺基礎模型,需要視覺數據。 (B) 純圖像數據。 不正確。 雖然圖像數據是其核心,但「純圖像」不足以讓它具備多模態的理解能力。如果只有圖像,它可能擅長圖像分類或物體偵測,但無法理解圖像與語言之間的關係。 (C) 帶有描述性文本的圖像數據。 正確。 這正是 Florence 這類多模態視覺模型的核心訓練方式。透過這種方式,模型能夠學習到圖像內容的語義,並將視覺信息與語言信息對齊,從而能夠處理圖像標註、圖像檢索、視覺問答等任務。 (D) 僅限於音訊數據。 不正確。 音訊數據用於聲音辨識或語音處理模型。Florence 主要專注於視覺和文本模態。 Florence 的應用潛力 由於其多模態的理解能力,Florence 能夠支援廣泛的電腦視覺任務,包括: 圖像分類和識別 物體偵測和分割 圖像標註 (Image Captioning):為圖像自動生成文字描述。 視覺問答 (Visual Question Answering, VQA):回答關於圖像內容的問題。 跨模態檢索:用文字描述來搜尋圖像,或用圖像來搜尋相關文字。 總之,Microsoft Florence 是一個利用大量圖像-文本對進行訓練的多模態模型,旨在實現對視覺世界的更深層次理解。 ::: 13. 在文件辨識服務中,「預生成模型」的主要特點是什麼? (A) 需要用戶提供大量自訂數據進行訓練。 (B) 針對常見文件類型(如餐飲帳單、銀行對帳單)進行預訓練,以識別關鍵字段。 (C) 只能識別手寫文字,無法處理印刷文字。 (D) 僅用於文件的格式轉換,不提取內容. :::spoiler **答案** B 「預生成模型」在文件辨識中的概念 在文件辨識服務(例如光學字元辨識 OCR 服務,或更進階的智能文件處理 IDP 服務)中,「預生成模型」(Pre-trained Model)是指已經由服務提供商在大量數據上訓練好的模型。這些模型不需要用戶從頭開始訓練,可以直接使用,大大降低了使用的門檻和時間成本。 選項分析 (A) 需要用戶提供大量自訂數據進行訓練。 不正確。 這是自訂模型 (Custom Model) 的特點,而非預生成模型。預生成模型就是為了讓用戶不必提供數據訓練即可直接使用。 (B) 針對常見文件類型(如餐飲帳單、銀行對帳單)進行預訓練,以識別關鍵字段。 正確。 預生成模型的最大價值在於,它們針對特定且常見的文件類型進行了廣泛的預訓練。這使得它們能夠自動識別和提取這些文件中的關鍵資訊或字段,例如: 餐飲帳單: 商家名稱、日期、總金額、品項明細等。 銀行對帳單: 帳戶號碼、交易日期、金額、收支明細等。 發票、護照、駕照等常見格式文件也是預生成模型常見的目標。 這使得用戶能夠快速、高效地從這些標準化或半結構化文件中提取所需數據,無需自行建構複雜的辨識邏輯。 (C) 只能識別手寫文字,無法處理印刷文字。 不正確。 現代的文件辨識服務,無論是預生成模型還是自訂模型,通常都能夠同時處理印刷文字和手寫文字(儘管手寫文字的辨識難度較高,準確性可能略低)。預生成模型會針對兩種文字類型進行訓練以提高泛用性。 (D) 僅用於文件的格式轉換,不提取內容。 不正確。 文件辨識服務的核心功能就是提取和理解文件中的內容(例如文字、數值、表格結構),而不僅僅是進行格式轉換(例如 PDF 轉 Word)。雖然有些服務可能附帶格式轉換功能,但內容提取才是其主要價值。 ::: 14. 人臉辨識技術在安全監控系統中的應用,下列敘述何者最為正確? (A) 僅用於檢測人臉是否存在,無法識別身份。 (B) 可用於識別特定個體,提高門禁系統的安全性。 (C) 只能識別靜態圖片中的人臉,無法處理影片。 (D) 主要功能是美化人臉圖像。 :::spoiler **答案** B ::: 15. 生成對抗網路(GAN)在生成式AI中的作用是什麼? (A) 主要用於文本分類。 (B) 由生成器和判別器組成,用於生成擬真的數據。 (C) 是一種監督式學習演算法。 (D) 只能處理結構化數據。 :::spoiler **答案** B ### **生成對抗網路(GAN)在生成式 AI 中的作用** **生成對抗網路(Generative Adversarial Networks, GANs)**是由 Ian Goodfellow 等人在 2014 年提出的一種強大且創新的深度學習模型。它是**生成式 AI (Generative AI)** 領域中的一個核心技術,其主要作用就是**生成高度擬真(或稱「逼真」)的數據**。 GAN 的獨特之處在於其「對抗性」的訓練框架,它由兩個神經網路組成,彼此進行「博弈」: 1. **生成器 (Generator, G)**: * **作用**:負責從隨機噪音中學習生成新的數據樣本。它的目標是生成盡可能真實的數據,以假亂真,騙過判別器。 2. **判別器 (Discriminator, D)**: * **作用**:負責判斷輸入的數據是真實的(來自真實數據集)還是由生成器生成的虛假數據。它的目標是準確地區分真假。 在訓練過程中,生成器不斷嘗試生成更逼真的數據來愚弄判別器,而判別器則不斷提高其辨別真假的能力。這種「貓捉老鼠」般的對抗性訓練,使得兩個網路的能力都得到提升,最終生成器能夠創造出與真實數據非常相似的新數據。 --- ### **選項解釋** * **(A) 主要用於文本分類。** * **不正確。** 文本分類是一種**判別式任務 (Discriminative Task)**,旨在將文本歸類到預定義的類別中。GAN 的核心功能是「生成」數據,而非「分類」數據。雖然 GAN 的某些變體可能用於文本生成或數據增強,間接服務於下游任務,但其主要作用不是分類。 * **(B) 由生成器和判別器組成,用於生成擬真的數據。** * **正確。** 這精確描述了 GAN 的核心架構和其在生成式 AI 中的關鍵作用。GANs 被廣泛應用於生成圖像(例如人臉、風景)、音頻、影片甚至文字等各種擬真數據。 * **(C) 是一種監督式學習演算法。** * **不正確。** GAN 的訓練過程通常被認為是**非監督式學習 (Unsupervised Learning)** 或**半監督式學習 (Semi-supervised Learning)** 的一種形式。雖然判別器在訓練時需要真實數據和生成數據的標籤(真/假),但生成器並沒有直接的標籤來指導它生成特定類型的數據,它只是學習數據的分佈。這與傳統的監督式學習(需要大量標註數據來訓練模型)有本質區別。 * **(D) 只能處理結構化數據。** * **不正確。** GAN 最著名的應用和突破性進展主要集中在**非結構化數據**的生成上,尤其是圖像(例如,生成逼真的人臉、物體、風景圖片)。它也能處理音頻、影片和文本等非結構化數據,而非僅限於表格數據或資料庫中的結構化數據。 --- ::: 16. 某電商公司希望透過AI技術提升其客戶服務,讓系統能自動識別用戶語音並生成自然流暢的文字回覆。此需求最適合運用下列哪兩項AI應用功能? (A) 知識挖掘與智慧文件處理。 (B) 電腦視覺與生成式AI。 (C) 自然語言處理與生成式AI。 (D) 智慧文件處理與電腦視覺。 :::spoiler **答案** C ::: 17. 在電腦視覺應用中,下列哪一項不是電腦視覺的核心技術? (A) 圖像處理。 (B) 特徵提取。 (C) 物件檢測。 (D) 資料加密。 :::spoiler **答案** D ::: 18. 下列哪一種自然語言處理技術最適合用於分析大量客戶評論,以了解客戶對產品或服務的情感傾向(正面、負面或中性)? (A) 機器翻譯。 (B) 語音識別。 (C) 情感分析。 (D) 自然語言生成。 :::spoiler **答案** C ::: 19. 知識挖掘的應用中,若要分析基因數據,發現疾病相關的基因變異,並推動個人化醫療,屬於哪個領域的應用? (A) 金融。 (B) 製造業。 (C) 醫療。 (D) 娛樂行業。 :::spoiler **答案** C ::: 20. 智慧文件處理的核心技術,除了光學字元辨識(OCR)、自然語言處理(NLP)和機器學習外,還包括哪一項自動化技術? (A) 數據視覺化。 (B) 機器人流程自動化(RPA)。 (C) 數據庫管理系統。 (D) 網路安全協議。 :::spoiler **答案** B 智慧文件處理 (Intelligent Document Processing, IDP) 的核心技術 智慧文件處理 (IDP) 是一種自動化解決方案,旨在從各種文件(包括非結構化、半結構化和結構化文件)中提取、理解和處理資訊。它超越了傳統的 OCR,結合了多種先進技術來實現端到端的自動化。 IDP 的主要核心技術包括: 光學字元辨識 (OCR): 功能: 將文件影像中的文字轉換為可編輯和可搜尋的機器編碼文字。這是 IDP 的基礎。 自然語言處理 (NLP): 功能: 理解和分析提取出的文字內容。NLP 幫助 IDP 理解文件的語義、識別關鍵實體、分類文件、並從非結構化文本中提取有意義的資訊。 機器學習 (ML) 和 深度學習 (DL): 功能: 驅動 IDP 的智慧學習能力。ML/DL 模型能夠學習文件的模式、佈局、以及資訊的關聯性,從而提高辨識和提取的準確性,並能處理多樣化的文件類型和變體。 機器人流程自動化 (RPA): 功能: 將從文件處理中提取的數據應用到後續的業務流程中,實現端到端的自動化。 RPA 機器人可以模擬人類操作電腦的行為,例如將提取的數據輸入到企業資源規劃 (ERP) 系統、客戶關係管理 (CRM) 系統、資料庫或其他應用程式中,觸發工作流程,或發送通知。它是連接文件內容理解與實際業務操作之間的橋樑,實現流程自動化。 選項分析 (A) 數據視覺化 (Data Visualization): 作用: 透過圖表和圖像呈現數據,幫助人們理解數據中的模式和趨勢。 不適用性: 它是數據分析的結果呈現工具,而不是文件處理流程中的核心自動化技術。 (B) 機器人流程自動化(RPA): 作用: 如上所述,RPA 是將 IDP 提取的資訊整合到業務流程中的關鍵技術,實現數據的自動流轉和後續操作。 適用性: 這是 IDP 實現自動化工作流程不可或缺的一部分。 (C) 數據庫管理系統 (Database Management System, DBMS): 作用: 用於儲存、組織和管理數據。 不適用性: 數據庫是存放處理後數據的基礎設施,但它本身不是 IDP 內部的自動化處理技術。 (D) 網路安全協議 (Network Security Protocols): 作用: 確保數據在網路傳輸中的安全性和隱私。 不適用性: 這是資訊安全領域的技術,與文件內容的提取和流程自動化本身沒有直接關係。 ::: 21. 下列哪一項是生成式AI在虛擬現實(VR)應用中的一個例子? (A) 測量VR頭盔的重量。 (B) 自動生成逼真的虛擬環境和角色。 (C) 分析VR遊戲的銷售數據。 (D) 提高VR設備的電池壽命。 :::spoiler **答案** B ::: 22. 下列關於大型語言模型(LLM)的敘述何者正確? (A) LLM主要基於預定義的規則進行文本處理。 (B) LLM的訓練數據僅限於結構化文本。 (C) LLM基於大規模數據和深度神經網絡結構,能夠處理和生成複雜的自然語言文本。 (D) LLM無法執行翻譯或內容摘要等自然語言處理任務。 :::spoiler **答案** C ::: 23. 在自然語言處理(NLP)中,「實體連結(Entity Linking)」技術的主要目的是什麼? (A) 識別文本中的情感傾向。 (B) 將文本中的實體連結到對應的知識庫頁面,提供更多背景訊息。 (C) 自動生成文本摘要。 (D) 將語音轉換為文本。 :::spoiler **答案** B 實體連結 (Entity Linking) 的核心目的 實體連結 (Entity Linking) 是自然語言處理 (NLP) 中的一項關鍵技術,它的主要目標是解決詞義消歧 (Word Sense Disambiguation) 的問題,特別是針對文本中提到的命名實體(如人名、地名、組織名等)。由於同一個詞可能指代不同的實體(例如,「蘋果」可以是水果,也可以是科技公司),實體連結的任務就是將文本中識別出的實體,正確地對應到一個標準的知識庫 (Knowledge Base) 中的唯一實體。 這樣做的好處是,一旦實體被連結到知識庫(如維基百科、Freebase、或專門的領域知識庫),就能為該實體提供豐富的背景訊息和語義上下文,從而提高機器對文本理解的深度。 選項分析 (A) 識別文本中的情感傾向。 不正確。 這是情感分析 (Sentiment Analysis) 的主要目的,它關注的是文本表達的語氣或情緒(正向、負向、中立)。 (B) 將文本中的實體連結到對應的知識庫頁面,提供更多背景訊息。 正確。 這正是實體連結的核心功能。例如,在文本中提到「喬丹」時,實體連結會判斷是指籃球運動員「麥可·喬丹」還是品牌「喬丹鞋」,並將其連結到維基百科上對應的頁面,提供其出生日期、職業生涯、成就等詳細資訊。 (C) 自動生成文本摘要。 不正確。 這是文本摘要 (Text Summarization) 的目的,它旨在從較長的文本中自動提取或生成簡潔的內容梗概。 (D) 將語音轉換為文本。 不正確。 這是語音轉文字 (Speech-to-Text 或 Automatic Speech Recognition, ASR) 的功能,它將口語音訊轉換為書面文字。 ::: 24. 語音辨識技術的核心運作方式是將口語轉換為機器可處理的資料,主要通過哪種方式實現? (A) 圖像生成。 (B) 轉錄文本。 (C) 數據加密。 (D) 物體檢測。 :::spoiler **答案** B ::: 25. 在生成式AI模型中,Transformer模型的核心優勢是什麼? (A) 依賴傳統遞歸神經網路(RNN)處理序列數據。 (B) 透過自注意力機制,能夠高效並行處理長序列數據和複雜的語言結構。 (C) 僅用於圖像分類,不適用於自然語言處理。 (D) 不需要大量數據訓練即可達到高性能。 :::spoiler **答案** B Transformer 模型簡介 Transformer 模型是 2017 年由 Google Brain 團隊提出的一種深度學習架構,它徹底改變了自然語言處理 (NLP) 領域,並且是當前許多先進生成式 AI 模型(如 GPT 系列、BERT 等)的基礎。它的提出解決了傳統序列模型的一些限制,特別是處理長序列數據的能力。 Transformer 的核心突破在於**「自注意力機制」(Self-Attention Mechanism)**。 選項分析 (A) 依賴傳統遞歸神經網路(RNN)處理序列數據。 不正確。 這恰恰是 Transformer 與傳統 RNN (如 LSTM、GRU) 的主要區別和最大優勢所在。RNN 依賴於序列的遞歸處理,前一個時間步的輸出是下一個時間步的輸入,這導致它難以進行並行計算,並且在處理長序列時容易出現梯度消失/爆炸的問題,難以捕捉遠距離的依賴關係。Transformer 正是為了克服這些限制而設計的,它完全摒棄了遞歸結構。 (B) 透過自注意力機制,能夠高效並行處理長序列數據和複雜的語言結構。 正確。 這完美地描述了 Transformer 的核心優勢: 自注意力機制: 允許模型在處理序列中的某個詞時,同時考慮序列中所有其他詞的重要性(權重),從而捕捉到詞語之間的遠距離依賴關係,無論它們在序列中相距多遠。 高效並行處理: 由於自注意力機制不再依賴於前一個時間步的輸出,而是可以同時計算所有詞語的注意力權重,這使得 Transformer 在訓練時能夠實現高度並行化,大大加快了訓練速度,尤其是在處理長序列時。 處理複雜語言結構: 自注意力機制讓模型能夠更好地理解複雜的語法結構和上下文語義。 (C) 僅用於圖像分類,不適用於自然語言處理。 不正確。 Transformer 模型最初是為自然語言處理 (NLP) 設計的,在機器翻譯、文本摘要、問答系統等方面取得了巨大成功。雖然它後來也被應用於電腦視覺(例如 ViT, Vision Transformer),但說它「僅用於圖像分類」且「不適用於 NLP」是完全錯誤的。 (D) 不需要大量數據訓練即可達到高性能。 不正確。 相反,Transformer 模型通常需要非常大量的數據進行訓練才能發揮其潛力,特別是那些達到頂級性能的大型語言模型。它們的強大性能很大程度上是建立在龐大數據集的基礎上。 ::: 26. 下列哪一項是生成式AI與鑑別式AI整合應用的典型案例? (A) 生成模擬交通場景,以訓練自動駕駛模型。 (B) 使用CNN對腫瘤進行分類診斷。 (C) 使用SVM分析金融風險。 (D) 創建更好的分類演算法。 :::spoiler **答案** A ::: 27. 在電腦視覺服務中,下列何者「不是」其功能用途之一? (A) 光學字元辨識。 (B) 描述和產生標籤。 (C) 資料庫設計與管理。 (D) 物件偵測。 :::spoiler **答案** C ::: 28. 若要為一部電影劇本進行自動文本生成,並使其內容自然流暢、風格多樣,最適合採用下列哪一種AI應用技術? (A) 電腦視覺。 (B) 自然語言生成 (屬於生成式AI)。 (C) 知識挖掘。 (D) 智慧文件處理。 :::spoiler **答案** B ::: 29. 在健康情況文字分析中,能夠識別文本中概念之間的有意義關聯(如將條件名稱與時間聯繫起來)的功能是? (A) 具名實體辨識。 (B) 關聯擷取。 (C) 實體連結。 (D) 判斷提示偵測。 :::spoiler **答案** B ::: 30. 在大型語言模型(LLM)的訓練過程中,將文本分解成最小的文字單位,稱為? (A) 特徵。 (B) 標籤。 (C) 語彙基元(Token)。 (D) 參數。 :::spoiler **答案** C 語彙基元 (Token) 的概念 在自然語言處理 (NLP) 和大型語言模型 (LLM) 中,將原始文本轉換成模型能夠處理的數值形式的第一步就是分詞 (Tokenization)。這個過程會將連續的文本分解成離散的、較小的文字單元,這些單元就是 語彙基元 (Token)。 Tokens 的形式可以有很多種,取決於所使用的分詞策略: 單詞 (Word-level Tokens):例如,將句子 "Hello world!" 分解為 "Hello", "world", "!"。 子詞 (Subword-level Tokens):這在 LLM 中非常常見,因為它可以處理未知詞彙(OOV, Out-Of-Vocabulary)問題。例如,"unhappiness" 可能會被分解為 "un", "##happi", "##ness"。這樣既能處理常見詞,也能通過組合子詞來表示不常見詞。 字元 (Character-level Tokens):將每個字元作為一個 Token。 這些 Tokens 隨後會被轉換成數值表示(例如透過嵌入層 Embedding Layer),供模型進行計算。 選項分析 (A) 特徵 (Feature):特徵是指從數據中提取出的可量化屬性。Token 可以作為模型的輸入特徵,但 Token 本身是「文字單位」,而不是更廣義的「特徵」。 (B) 標籤 (Label):標籤是監督式學習中,模型需要預測的目標值或類別。它與文本的分解無關。 (C) 語彙基元(Token):這正是指將文本分解成的最小文字單位。它精確描述了這個過程的產物。 (D) 參數 (Parameter):參數是模型在訓練過程中學習到的內部變數(例如神經網路中的權重和偏置)。它與文本的輸入預處理過程無關。 ::: # 3 - 負責任的AI應用 1. 負責任人工智慧(Responsible AI)的主要目標是什麼? (A) 僅關注AI系統的效能和速度。 (B) 確保AI系統的開發和部署以安全、可靠且道德的方式進行。 (C) 盡可能減少人類對AI系統的干預。 (D) 專注於生成新數據,而不考慮其社會影響。 :::spoiler **答案** B ::: 2. 負責任AI的「公平性」原則指的是什麼? (A) AI系統應對所有用戶提供完全相同的服務。 (B) AI系統應公正無偏地對待每個人,避免以不同的方式影響處境相似的群體。 (C) AI系統應優先服務於對社會貢獻最大的群體。 (D) AI系統的數據來源必須是完全匿名的。 :::spoiler **答案** B ::: 3. 關於AI造成的「配置損害」(Allocative harm),下列敘述何者正確? (A) 指AI系統在不同族群中的運作效能存在差異。 (B) 範例包括AI系統在招聘過程中偏向特定群體,導致其他群體失去機會。 (C) 主要發生在AI系統生成藝術作品時出現偏頗。 (D) 僅限於金融領域的貸款審批問題。 :::spoiler **答案** B 「配置損害」(Allocative Harm)的解釋 「配置損害」(Allocative harm)是指當AI系統的偏見導致資源、機會或服務在不同群體之間被不公平地分配或剝奪時所造成的損害。這種損害通常會直接影響到人們的物質利益或生活機會。 選項分析 (A) 指AI系統在不同族群中的運作效能存在差異。 不正確。 這描述的是「性能差異」(Performance Disparity)或「服務品質損害」(Quality of Service Harm),例如人臉辨識系統對某些膚色的辨識準確度較低。這是一種偏見,但它強調的是功能表現上的不平等,而非直接的資源分配不公。雖然兩者相關,但概念不同。 (B) 範例包括AI系統在招聘過程中偏向特定群體,導致其他群體失去機會。 正確。 這是「配置損害」的一個典型且廣為人知的例子。如果AI招聘工具在評估候選人時,因為其種族、性別或其他受保護的屬性而給予偏低的評分,導致他們無法獲得面試或工作機會,這就直接造成了機會的分配不公,剝奪了這些群體獲得資源(工作)的權利。其他例子還包括AI在貸款審批、信用評分、住房申請等方面造成的偏見。 (C) 主要發生在AI系統生成藝術作品時出現偏頗。 不正確。 這更像是「代表性損害」(Representational Harm)或「刻板印象生成」。例如,AI生成圖片時,如果總是將特定職業與單一性別或種族聯繫起來,這會強化刻板印象。這是一種AI倫理問題,但與資源或機會的直接分配不公不同。 (D) 僅限於金融領域的貸款審批問題。 不正確。 雖然金融領域的貸款審批確實是「配置損害」的一個重要案例,但這種損害並不限於該領域。它可以在任何涉及資源、機會或服務分配的領域發生,例如:教育入學、醫療服務分配、刑事司法系統中的保釋判決等。 ::: 4. 語音識別系統對某些口音的識別準確性較低,導致這些用戶體驗不佳,這屬於AI造成的哪種損害? (A) 配置損害。 (B) 服務品質的損害。 (C) 數據隱私損害。 (D) 透明度損害。 :::spoiler **答案** B AI 損害類型解析 (A) 配置損害 (Allocative harm): 指 AI 系統導致資源、機會或服務在不同群體間被不公平地分配或剝奪。例如,AI 在招聘中偏向特定群體,導致其他人失去工作機會。 不適用於此情境,因為語音識別的準確性問題並非直接分配資源。 (B) 服務品質的損害 (Quality of Service harm): 指 AI 系統對不同群體或個人提供不同品質的服務或不同的效能水準。在這種情況下,某些群體(例如特定口音的使用者)由於系統辨識率較低而無法獲得與其他群體相同水準的服務體驗。 適用於此情境,因為問題的核心在於語音識別系統的「性能差異」或「服務品質不均」。 (C) 數據隱私損害 (Data Privacy harm): 指 AI 系統在收集、儲存、處理或使用個人數據時,未能適當保護用戶隱私,導致數據洩露、濫用或未經同意的收集。 不適用於此情境,問題與數據洩露無關。 (D) 透明度損害 (Transparency harm): 指 AI 系統的內部運作機制、決策過程或偏見來源不夠公開透明,導致用戶難以理解或信任系統的行為。 不適用於此情境,雖然可解釋性是重要議題,但核心問題是性能差異,而非缺乏透明度。 ::: 5. 負責任AI的「可靠性和安全性」原則要求AI系統具備什麼能力? (A) 能夠自動修復所有錯誤而無需人工干預。 (B) 以可靠、安全且一致的方式運作,並能安全地回應非預期的狀況。 (C) 優先處理高風險任務,犧牲低風險任務的穩定性。 (D) 僅在學術研究環境中確保其安全性。 :::spoiler **答案** B ::: 6. 下列何者是保護AI系統中「隱私權與保密性」的法律要求之一? (A) 要求所有AI系統數據必須儲存於本地伺服器。 (B) 要求資料收集、使用及儲存相關透明度。 (C) 禁止AI系統收集任何個人數據。 (D) 僅允許政府機構存取AI系統中的敏感數據。 :::spoiler **答案** B ::: 7. 在電子設備製造業中,若AI系統的品質檢查功能僅考慮視力正常的工人,而未加入語音提示功能以幫助視力障礙工人,這違反了負責任AI的哪項原則? (A) 可靠性和安全性。 (B) 透明度。 (C) 包容性。 (D) 責任。 :::spoiler **答案** C 負責任 AI 原則解析 負責任 AI (Responsible AI) 旨在確保 AI 系統的開發和使用符合倫理、公平和社會福祉。其中包含了多項核心原則: (A) 可靠性和安全性 (Reliability and Safety): 此原則強調 AI 系統應運作穩定、準確、可預測,並應設計成在各種情況下都能避免造成傷害或不必要的風險。 在此情境中,問題不在於系統本身是否穩定或安全地執行其主要品質檢查功能,而是其設計未能涵蓋所有潛在用戶。 (B) 透明度 (Transparency): 此原則要求 AI 系統的運作方式、決策過程及其背後的邏輯應盡可能地清晰、可解釋和可追溯,以便用戶能夠理解其輸出。 此情境與 AI 系統的內部解釋性無關,而是關於其可及性設計。 (C) 包容性 (Inclusiveness): 此原則要求 AI 系統應為多元化的用戶群體服務,避免歧視,並確保系統設計能夠公平地惠及所有人,不因用戶的背景、能力(包括殘疾)或其他特徵而造成排斥或不便。在這種情況下,若 AI 系統未能提供視力障礙工人所需的輔助功能(如語音提示),就違反了使其具備包容性、讓所有潛在用戶都能公平使用的原則。 此情境完美符合包容性原則的缺失,因為系統設計排除了視力障礙工人有效利用其功能。 (D) 責任 (Accountability): 此原則要求對 AI 系統的行為和決策負責。當 AI 系統造成損害時,必須有明確的機制來追溯責任歸屬,並確保有補救措施。 雖然設計出不具包容性的系統會引發責任問題,但「責任」本身是關於追究誰來承擔後果的機制,而直接被違反的原則是「包容性」。 ::: 8. 負責任AI的「透明度」原則主要旨在達到什麼目標? (A) 確保AI系統的程式碼完全公開。 (B) 讓使用者能夠充分理解AI系統的用途、工作原理及其局限性。 (C) 使AI系統的決策過程完全由人類控制。 (D) 僅提供AI系統的最終預測結果。 :::spoiler **答案** B 負責任 AI 的「透明度」原則 「透明度」(Transparency)是負責任 AI 的核心原則之一,旨在確保 AI 系統的運作方式不是一個「黑箱」,而是可被理解、可被解釋和可被追溯的。 選項分析 (A) 確保AI系統的程式碼完全公開。 不正確。 雖然公開原始碼(開源)有助於提高透明度,但「透明度」原則的涵蓋範圍更廣,它不必然要求所有 AI 系統的程式碼都完全公開,尤其對於商業機密或複雜性極高的模型。透明度更側重於理解系統的決策邏輯和行為。 (B) 讓使用者能夠充分理解AI系統的用途、工作原理及其局限性。 正確。 這正是「透明度」原則的核心目標。它包括: 理解用途: 系統是設計來做什麼的? 理解工作原理: 系統是如何做出判斷或預測的?它考慮了哪些因素?背後的邏輯是什麼? 理解局限性: 系統在哪種情況下可能出錯?它的準確性範圍是什麼?存在哪些潛在的偏見? 透過提高透明度,可以建立使用者對 AI 的信任,並在出現問題時更容易進行診斷和糾正。 (C) 使AI系統的決策過程完全由人類控制。 不正確。 這描述的是「人類控制」(Human Control)或「人類在環」(Human-in-the-loop)的原則,它關注的是人類對 AI 系統的監督和干預能力,而非透明度本身。透明度是實現有效人類控制的基礎,但不是其目標。 (D) 僅提供AI系統的最終預測結果。 不正確。 這恰好是「非透明」(opaque)系統的特點。如果只提供最終結果而不解釋其推導過程,那麼系統就是一個「黑箱」,這與透明度原則的目標背道而馳。 ::: 9. 關於負責任AI的「責任」原則,下列敘述何者正確? (A) AI系統本身應對其行為結果負責。 (B) AI系統的設計和部署人員應對其運作方式負責。 (C) 只有AI系統的使用者需承擔所有風險。 (D) 責任原則僅適用於政府機構開發的AI系統。 :::spoiler **答案** B ::: 10. 負責任AI儀表板(Responsible AI Dashboard)提供單一介面,其主要目的是什麼? (A) 專門用於AI模型的訓練加速。 (B) 協助在實務上有效率地進行負責任AI的實施。 (C) 取代數據科學家進行所有數據分析工作。 (D) 僅用於生成式AI模型的評估。 :::spoiler **答案** B ::: 11. 下列何者「不是」負責任AI儀表板整合的領域之一? (A) 模型效能與公平性評量。 (B) 資料探索。 (C) 機器學習可解譯性。 (D) 企業資源規劃(ERP)。 :::spoiler **答案** D ::: 12. 在評量AI模型的公平性時,下列哪一種計量旨在計算選定效能計量在資料子群體間的差異值? (A) 預測精準度。 (B) 模型效能的差異。 (C) 數據一致性。 (D) 計算複雜度。 :::spoiler **答案** B AI 模型公平性評量與效能差異 在評量 AI 模型的公平性時,一個核心的考量是確保模型對不同群體(例如不同性別、種族、年齡層、社經地位等)的表現是一致且公平的。 公平性 (Fairness):AI 模型不應該對任何特定群體產生系統性的偏見或歧視性結果。 選項分析 (A) 預測精準度 (Prediction Accuracy): 作用: 這是衡量模型在所有數據點上正確預測的比例。它是一個總體的性能指標,不直接揭示在不同子群體之間的表現是否存在差異。模型可能整體精準度很高,但在某些弱勢群體上表現很差。 不適用性: 無法直接衡量子群體間的差異。 (B) 模型效能的差異 (Model Performance Disparity): 作用: 這正是衡量 AI 模型公平性的關鍵計量之一。它旨在計算和比較選定的性能計量(如精準度、召回率、F1 分數、錯誤率、真陽性率、假陽性率等)在不同資料子群體之間的差距。如果這個差異值很大,就可能表示模型存在公平性問題。 適用性: 直接對應題目描述,旨在計算子群體間的差異值。 (C) 數據一致性 (Data Consistency): 作用: 衡量數據的準確性、完整性和可靠性,確保數據在不同來源或時間點上保持一致。它屬於數據品質的範疇。 不適用性: 與模型性能在子群體間的差異無關。 (D) 計算複雜度 (Computational Complexity): 作用: 衡量模型訓練或推斷所需的計算資源(時間和記憶體)。它是一個效率指標。 不適用性: 與模型的公平性或性能差異無關。 ::: 13. 製造業中,瑕疵檢測模型在不同班次(早班90%,晚班80%)的精確率存在差異,這屬於哪種公平性問題? (A) 選取率的差異。 (B) 錯誤率的差異。 (C) 精確率的差異。 (D) 召回率中的差距。 :::spoiler **答案** C AI 公平性問題類型解析 在評估 AI 模型公平性時,我們經常會分析不同效能指標在不同群體之間的表現。 精確率 (Precision):在所有模型預測為正例的結果中,有多少比例是真正的正例。在瑕疵檢測中,精確率高表示模型「預測有瑕疵的產品中,真正有瑕疵的比例很高」,即誤報率低。 選項分析 (A) 選取率的差異 (Disparity in Selection Rate): 選取率(或稱影響率、錄取率)是指模型將特定群體歸類為「正例」(例如,判斷為有瑕疵、錄取、核准)的比例。 如果不同班次被判斷為「有瑕疵」的產品比例顯著不同,這會是選取率的差異。但題目明確指出是精確率的差異。 (B) 錯誤率的差異 (Disparity in Error Rate): 錯誤率是模型預測錯誤的總比例。 雖然精確率的差異會導致總體錯誤率的構成在不同群體間有所不同,但這裡直接指出了特定指標「精確率」的差異,因此有更精確的選項。 (C) 精確率的差異 (Disparity in Precision): 這直接對應題目所描述的問題。 題目明確指出「精確率存在差異」(早班90%,晚班80%)。這意味著模型在不同班次(視為不同數據子群體)上的精確率這個性能指標表現不同。這是判斷模型公平性的一個重要指標,因為它影響了不同班次製造產品的誤報率。 (D) 召回率中的差距 (Gap in Recall): 召回率(或稱敏感度)是指在所有真正的正例中,模型正確識別出的比例。在瑕疵檢測中,召回率高表示模型「所有真正有瑕疵的產品中,有多少比例被檢測出來」,即漏報率低。 題目明確指出是精確率的差異,而非召回率。 ::: 14. 錯誤分析為何是確保AI系統可靠性與安全性的關鍵步驟? (A) 僅用於提高模型的訓練速度。 (B) 透過識別和分析模型的錯誤,找到系統弱點並進行改進。 (C) 專門用於數據加密,防止資料外洩。 (D) 僅關注模型的整體精確度,不考慮局部錯誤。 :::spoiler **答案** B ::: 15. 「可解釋性」在AI系統透明度中的重要性是什麼? (A) 減少模型所需的訓練數據量。 (B) 讓利害關係人理解AI系統的運作方式及其原因。 (C) 提高模型的運行速度。 (D) 降低AI系統的開發成本。 :::spoiler **答案** B ::: 16. 下列何者「不是」AI系統背景下的主要利害關係人? (A) 開發人員。 (B) 使用者。 (C) 競爭對手的產品。 (D) 政府機構。 :::spoiler **答案** C ::: 17. Azure機器學習中,通過MLOps(機器學習操作)來實現「權責」的主要方式不包括下列哪一項? (A) 模型註冊、打包和部署。 (B) 治理數據捕獲。 (C) AI系統的硬體製造。 (D) 運營監控。 :::spoiler **答案** C MLOps(機器學習操作)與「權責」 MLOps (Machine Learning Operations) 是一套實踐和工具,旨在將機器學習模型的開發(Dev)和運營(Ops)結合起來,以實現高效、可靠且負責任的機器學習系統部署和維護。在 MLOps 中實現「權責」(Accountability)是指確保整個機器學習生命週期中的透明度、可追溯性、治理和歸責。 權責在 MLOps 中的體現: 可追溯性: 能夠追溯模型的開發過程、使用的數據、訓練參數、部署歷史和性能。 治理: 確保數據和模型的合規性、倫理使用和管理。 監控: 持續監控模型在生產環境中的性能和行為,以便及時發現並解決問題。 選項分析 (A) 模型註冊、打包和部署 (Model registration, packaging, and deployment): 屬於 MLOps 實現權責的方式。 模型註冊提供了版本的歷史記錄和元數據,使得模型可被追溯;打包和部署確保了模型在生產環境中的標準化和可控性,有助於問題追蹤和版本管理。 (B) 治理數據捕獲 (Governing data capture): 屬於 MLOps 實現權責的方式。 數據是機器學習模型的基礎。對數據的捕獲、儲存、處理和使用進行治理,確保數據的品質、倫理和合規性,是實現模型權責的關鍵一步。如果數據有偏見或問題,會直接影響模型的公平性和性能,進而影響權責。 (C) AI系統的硬體製造 (Hardware manufacturing for AI systems): 不屬於 MLOps 實現權責的方式。 硬體製造屬於更廣泛的 IT 基礎設施和供應鏈管理範疇,與機器學習模型本身的開發、訓練、部署、監控和治理(MLOps 的核心關注點)並無直接關係。MLOps 關注的是模型軟體生命週期和數據流,而不是生產運行這些模型的物理硬體。 (D) 運營監控 (Operational monitoring): 屬於 MLOps 實現權責的方式。 持續監控模型在生產環境中的性能、數據漂移、概念漂移以及潛在的偏見,是確保模型持續符合預期行為和負責任運營的關鍵。透過監控,可以及時發現問題並採取糾正措施,這直接支持了權責原則。 ::: 18. 「原因推斷」技術的主要目的是什麼? (A) 預測未來數據的趨勢。 (B) 確定某一變量對另一變量的因果影響。 (C) 自動生成文本摘要。 (D) 檢測圖像中的異常物件。 :::spoiler **答案** B ::: 19. 「反事實分析」技術的主要用途是什麼? (A) 自動化數據清洗過程。 (B) 生成與當前情況略有不同的假設場景,以探索可能改變結果的特徵。 (C) 僅用於識別數據中的異常值。 (D) 分析模型在不同時間點的性能變化。 :::spoiler **答案** B 反事實分析 (Counterfactual Analysis) 的核心用途 反事實分析 (Counterfactual Analysis) 是機器學習可解釋性 (Explainable AI, XAI) 領域中的一項重要技術。它的主要目的是幫助人們理解一個 AI 模型做出特定預測或決策的原因,透過回答「如果輸入數據中的某些特徵稍微改變,結果會不會不同?」這樣「如果當初...」的假設性問題。 選項分析 (A) 自動化數據清洗過程。 不正確。 數據清洗是數據預處理的一部分,旨在處理數據中的錯誤、缺失值、噪音等,與反事實分析的目的無關。 (B) 生成與當前情況略有不同的假設場景,以探索可能改變結果的特徵。 正確。 這正是反事實分析的核心目標。它會建立一個「反事實」的例子,這個例子與原始輸入非常相似,但在某些關鍵特徵上有所不同,而這些不同恰好能夠導致模型做出不同的預測結果。 範例: 如果一個人申請貸款被拒絕,反事實分析可以告訴他:「如果你年收入多五萬元,你的貸款申請就會被批准。」這就指出了改變結果所需的最少變動,幫助用戶理解模型決策的敏感點。 在醫療診斷中,如果 AI 判斷為某種疾病,反事實分析可能指出:「如果血壓指數降低 5 個點,模型就會判斷為健康。」 (C) 僅用於識別數據中的異常值。 不正確。 識別異常值是異常偵測(Anomaly Detection)的任務,雖然它也涉及分析數據點,但其目的與反事實分析截然不同。 (D) 分析模型在不同時間點的性能變化。 不正確。 這屬於模型監控 (Model Monitoring) 的範疇,旨在追蹤模型在生產環境中性能是否下降,例如由於數據漂移(Data Drift)或概念漂移(Concept Drift)。 ::: 20. 「微擾」技術在負責任AI中的主要作用是什麼? (A) 評估模型在極端條件下的穩定性。 (B) 對數據進行小幅度的變動,以觀察這些變動對模型預測的影響。 (C) 減少模型訓練所需的計算資源。 (D) 自動修正模型中的錯誤。 :::spoiler **答案** B ::: 21. 根據歐盟《人工智慧法案》(AI Act),「社會評分系統」因對基本權利構成威脅而被禁止,屬於哪一風險類別? (A) 最小風險。 (B) 具體透明度風險。 (C) 高風險。 (D) 不可接受風險。 :::spoiler **答案** D ::: 22. 歐盟《人工智慧法案》(AI Act)的核心內容「不」包括下列何者? (A) 風險分類與合規要求。 (B) 透明度與問責機制。 (C) 鼓勵使用未經審核的AI系統。 (D) 罰則與執法。 :::spoiler **答案** C ::: 23. 根據中華民國生成式AI參考指引(草案),在引導行政院及所屬機關使用生成式AI時,強調的「核心原則」不包括下列何者? (A) 安全性與隱私性。 (B) 責任與問責。 (C) 數據完全公開化。 (D) 資料治理。 :::spoiler **答案** C 中華民國生成式 AI 參考指引(草案)核心原則 中華民國行政院通過的《行政院及所屬機關(構)使用生成式 AI 參考指引(草案)》旨在引導各行政機關在提升行政效率的同時,防範可能帶來的風險,確保公務執行的機密性、安全性、專業性以及個人權利的保障。 根據該指引,其核心原則和強調的重點包括: 安全性 (Safety):確保 AI 系統的使用不會導致資料外洩、系統漏洞或其他安全風險。 隱私性 (Privacy):明確禁止向生成式 AI 提供涉及公務應保密、個人及未經機關(構)同意公開之資訊。 資料治理 (Data Governance):強調對數據的負責任管理,包括數據的來源、使用和保護,以確保模型的公平性、準確性和可靠性。這也涵蓋了對數據的問責機制。 責任與問責 (Responsibility and Accountability):要求業務承辦人對生成式 AI 的產出資訊進行客觀且專業的最終判斷,不得完全取代人類的自主思維與判斷。同時,對於 AI 系統的使用應承擔相應的責任。 透明性與可解釋性 (Transparency and Explainability):要求適當揭露生成式 AI 的使用情況,並能解釋其產出結果的關聯性。 選項分析 (A) 安全性與隱私性: 包括在內。 指引明確強調要確保公務資訊的機密性與個人隱私保護,並留意安全性。 (B) 責任與問責: 包括在內。 指引要求業務承辦人需對 AI 產出的資訊進行最終判斷,並強調掌握自主權與控制權,這都指向責任與問責。資料治理問責也是其一部分。 (C) 數據完全公開化: 不包括在內。 相反,該指引明確禁止向生成式 AI 提供機密、應保密或未經同意公開的個人資訊。強調的是數據的保護和限制使用,而非完全公開。 (D) 資料治理: 包括在內。 數據治理(以及資料治理問責)是確保 AI 系統負責任運作的關鍵原則之一,涵蓋數據的整個生命週期管理。 因此,數據完全公開化 並不屬於中華民國生成式 AI 參考指引草案的核心原則,甚至與其強調的隱私保護和機密性相悖。 ::: 24. 根據中華民國生成式AI參考指引(草案),關於「機密文書撰寫」的規定為何? (A) 允許使用生成式AI輔助撰寫機密文書。 (B) 機密文書應由業務承辦人親自撰寫,禁止使用生成式AI。 (C) 只有在緊急情況下才能使用生成式AI撰寫機密文書。 (D) 機密文書可由生成式AI自動生成,但需人工審核。 :::spoiler **答案** B ::: 25. 企業評估是否導入AI應用時,關於「數據品質」的考量點不包括下列何者? (A) 數據完整性(沒有遺漏或缺失)。 (B) 數據一致性(在不同系統中是否一致)。 (C) 數據準確性(數據是否準確和真實)。 (D) 數據儲存成本的高低。 :::spoiler **答案** D ::: 26. 企業評估導入AI應用時,在「員工技能」方面應考慮哪些內容? (A) 僅需評估員工是否具備程式設計能力。 (B) 評估員工是否具備基本的AI知識、實踐經驗和進階技能。 (C) 僅需評估員工對新技術的接受度。 (D) 員工技能與AI導入無關。 :::spoiler **答案** B ::: 27. 若企業面臨「運營效率低」的痛點,下列哪項AI技術解決方案最為相關? (A) 使用生成式AI進行新產品設計。 (B) 使用機器人流程自動化(RPA)自動化重複性工作。 (C) 使用情感分析技術分析客戶反饋。 (D) 使用數據視覺化工具將複雜數據轉化為圖表。 :::spoiler **答案** B ::: 28. 若企業面臨「產品品質不穩定」的痛點,下列哪項AI技術解決方案最為相關? (A) 使用AI進行市場趨勢預測。 (B) 使用智慧客服機器人自動回應客戶查詢。 (C) 使用機器視覺技術進行產品檢測。 (D) 使用AI分析供應鏈數據,優化供應鏈管理。 :::spoiler **答案** C ::: 29. 企業評估導入AI應用的「風險評估」中,技術風險可能面臨的挑戰不包括下列何者? (A) 數據隱私問題。 (B) 技術成熟度。 (C) 市場行銷活動的成功率。 (D) 算法偏見。 :::spoiler **答案** C ::: 30. 負責任AI的實踐,除了技術層面的創新和改進外,還需要哪些方面的支持? (A) 僅需增加AI系統的運算能力。 (B) 法律、政策和倫理方面的支持。 (C) 專注於提高AI模型的準確性。 (D) 僅需由單一專業領域人員來負責。 :::spoiler **答案** B ::: # 4 - 機器學習技術理論與案例 1. 人工智慧(AI)具有多種特性,下列何者為其主要特性之一? (A) 僅能處理數值型資料。 (B) 學習能力、判斷能力、記憶能力與語言能力。 (C) 無法與人類進行互動。 (D) 專注於生成藝術作品。 :::spoiler **答案** B ::: 2. 關於強人工智慧(Strong AI),下列敘述何者正確? (A) 目前大多數人工智慧的應用都屬於強人工智慧。 (B) 強人工智慧只處理特定的問題,不具備人類完整的認知能力。 (C) 強人工智慧相當接近人類智慧,可以像人類一樣學習、理解和創造新知識,目前仍未真正出現。 (D) AlphaGo是一個典型的強人工智慧範例,已達到人類智慧的完整能力。 :::spoiler **答案** C ::: 3. 下列關於弱人工智慧(Weak AI)的敘述,何者正確? (A) 弱人工智慧具備人類完整的認知能力。 (B) 弱人工智慧能夠進行自我學習並超越人類在所有領域的能力。 (C) 弱人工智慧只處理特定的問題,不需要具有人類完整的認知能力,其設計看起像有智慧型即可。 (D) Siri、Alexa、Google語音助手均不屬於弱人工智慧的範疇。 :::spoiler **答案** C ::: 4. 機器學習(Machine Learning)在人工智慧領域中的主要目的為何? (A) 專注於開發能夠自我修復的硬體系統。 (B) 透過特殊演算法,讓電腦從大量數據中找出規律性並產生模型,然後利用模型進行預測。 (C) 僅用於生成新的創意內容,如音樂和藝術。 (D) 旨在完全取代人類的決策過程。 :::spoiler **答案** B ::: 5. 機器學習演算法主要用於哪些方面? (A) 僅限於資料的儲存與管理。 (B) 分類事物、辨識模式、預測結果與做出判斷。 (C) 專門用於硬體設備的故障排除。 (D) 僅用於學術研究,不適用於實際應用。 :::spoiler **答案** B ::: 6. 在機器學習的運作流程中,下列哪個步驟通常在模型訓練完成後進行,用來評估模型的實際表現? (A) 資料收集。 (B) 特徵選取。 (C) 訓練與測試。 (D) 模型定義。 :::spoiler **答案** C ::: 7. 監督式學習(Supervised Learning)的主要特性是什麼? (A) 使用未標籤化訓練資料來發現數據中的隱藏模式。 (B) 利用獎勵和懲罰機制來學習最佳行為策略。 (C) 使用標籤化訓練資料,建構出人工智慧模型,並可以針對未曾見過的輸入來預測輸出。 (D) 無需任何人工干預即可自動化所有決策。 :::spoiler **答案** C ::: 8. 非監督式學習(Unsupervised Learning)的主要應用範例是什麼? (A) Spam過濾器。 (B) 自動標籤分類。 (C) 信用卡盜刷檢測。 (D) CRM中的客戶細分。 :::spoiler **答案** D ::: 9. 強化學習(Reinforcement Learning)的特性不包括下列哪一項? (A) 學習策略,從未曾學過的資料中找出輸出序列。 (B) 透過獎勵和懲罰機制來學習最佳行為策略。 (C) 能夠進行知識萃取,所得規則易於理解。 (D) 沒有監督輸出可以參考,但延遲報酬。 :::spoiler **答案** C ::: 10. 下列哪一項機器學習應用類型是「非監督式」學習的方法? (A) 垃圾信過濾。 (B) 物體辨識。 (C) 分群(Clustering)。 (D) 片語辨識。 :::spoiler **答案** C ::: 11. 關於「過擬合(Overfitting)」現象,下列敘述何者正確? (A) 模型在訓練數據和未見過的新數據上都表現良好。 (B) 模型過於複雜,過度學習訓練數據中的噪音和細節,導致在新數據上性能不佳。 (C) 模型過於簡單,無法捕捉訓練數據中的重要模式。 (D) 增加訓練數據量可以加劇過擬合問題。 :::spoiler **答案** B 「過擬合(Overfitting)」現象的解釋 過擬合(Overfitting) 是機器學習模型訓練過程中常見的問題,尤其是在模型複雜度較高或訓練數據量相對較少時容易發生。 選項分析 (A) 模型在訓練數據和未見過的新數據上都表現良好。 不正確。 這描述的是一個泛化能力良好的模型,是我們訓練模型的理想目標,與過擬合恰好相反。 (B) 模型過於複雜,過度學習訓練數據中的噪音和細節,導致在新數據上性能不佳。 正確。 這精確地描述了過擬合現象。模型在訓練數據上表現出色(因為它「記住」了所有細節,包括噪音),但由於這些細節不具有普遍性,當面對未曾見過的新數據時,模型的預測能力就會顯著下降。 (C) 模型過於簡單,無法捕捉訓練數據中的重要模式。 不正確。 這描述的是欠擬合(Underfitting) 問題。欠擬合的模型在訓練數據上就表現不佳,更不用說在新數據上。 (D) 增加訓練數據量可以加劇過擬合問題。 不正確。 恰恰相反,增加訓練數據量(尤其是高質量且具有代表性的數據)是減少過擬合的常用且有效的方法之一。更多的數據有助於模型學習到更普遍、更具代表性的模式,而非訓練數據中的特定噪音。 ::: 12. 深度學習(Deep Learning)模仿了哪種生物器官的工作方式? (A) 心臟。 (B) 肺部。 (C) 人腦。 (D) 眼睛。 :::spoiler **答案** C ::: 13. 在深度學習神經網路中,負責接收新資訊並在不同層級處理資訊,且能調整其行為的組件被稱為? (A) 輸入層。 (B) 隱藏層。 (C) 輸出層。 (D) 感測器。 :::spoiler **答案** B ::: 14. 下列哪種深度學習演算法是生成式深度學習演算法,常用於創建類似於訓練數據的新資料實例,並包含生成器和鑑別器兩個元件? (A) 深度類神經網路(DNN)。 (B) 卷積類神經網路(CNN)。 (C) 長短期記憶網路(LSTM)。 (D) 生成對抗網路(GAN)。 :::spoiler **答案** D ::: 15. 卷積類神經網路(CNN)的主要應用領域是什麼? (A) 僅限於處理時間序列數據。 (B) 主要用於圖像處理和物體檢測。 (C) 專門用於生成自然語言文本。 (D) 無法處理連續圖片的特徵。 :::spoiler **答案** B ::: 16. 長短期記憶網路(LSTM)作為一種遞迴神經網路(RNN),其主要功能是什麼? (A) 專門用於圖像分類。 (B) 無法處理長期依賴關係的數據。 (C) 能夠學習和記憶長期依賴關係。 (D) 僅適用於非監督式學習任務。 :::spoiler **答案** C ::: 17. TensorFlow是由哪個科技巨頭開發並開源的機器學習框架? (A) Apple。 (B) Microsoft。 (C) Google。 (D) Amazon。 :::spoiler **答案** C ::: 18. Keras是一個用Python撰寫的OpenSource神經網路Library,其主要功能為何? (A) 僅用於資料庫管理。 (B) 處理模型(model)的建立與訓練等功能。 (C) 專門用於硬體設計。 (D) 僅提供數據視覺化功能。 :::spoiler **答案** B Keras 簡介 Keras 是一個用 Python 編寫的開源神經網路函式庫(或稱作 API 介面),它設計的初衷是為了讓深度學習模型的建構、訓練、評估和部署變得更快速、簡單和用戶友好。 它最初是一個獨立的專案,但因其易用性廣受歡迎,後來被 Google 整合並作為 TensorFlow 的官方高階 API 介面。這意味著當你使用 Keras 時,底層實際上可能是在利用 TensorFlow 強大的計算能力。 Keras 的核心理念是: 用戶友好性 (User friendliness):提供簡單、一致的介面,減少認知負荷。 模組化 (Modularity):模型是由獨立、可組合的模組(如層、優化器、激活函數)構成的。 易擴展性 (Extensibility):可以輕鬆添加新的模組和類別。 Keras 的主要功能與特點 模型建立 (Model Building): 提供兩種主要模型建立方式:Sequential API(用於簡單的層次堆疊模型)和 Functional API(用於更複雜、多輸入/多輸出、共享層或非線性拓撲的模型)。 內建豐富的層類型,如全連接層 (Dense)、卷積層 (Conv2D)、池化層 (MaxPooling2D)、循環層 (LSTM, GRU)、嵌入層 (Embedding) 等,以及各種激活函數。 模型訓練 (Model Training): 使用 model.compile() 來配置訓練過程,包括選擇優化器(如 Adam, SGD)、損失函數(如交叉熵、均方誤差)和評估指標(如準確度)。 使用 model.fit() 方法來執行模型的訓練,並支援批次訓練、週期訓練、驗證數據等。 模型評估與預測 (Model Evaluation and Prediction): 使用 model.evaluate() 來評估模型在測試數據上的性能。 使用 model.predict() 來對新數據進行預測。 模型保存與載入 (Model Saving and Loading): 可以方便地保存訓練好的模型結構和權重,以便後續載入和部署。 後端支援 (Backend Support): Keras 作為高階 API,可以運行在多個後端計算引擎上,最常用的是 TensorFlow,但也曾支援 Theano 和 CNTK。 選項分析 (A) 僅用於資料庫管理。 不正確。 Keras 是一個神經網路函式庫,與資料庫管理無關。 (B) 處理模型(model)的建立與訓練等功能。 正確。 這完全符合 Keras 的核心定位和功能。它提供了從定義網路結構、到編譯、訓練、評估和預測的完整流程。 (C) 專門用於硬體設計。 不正確。 Keras 是一個軟體函式庫,不是用於硬體設計或加速晶片開發。 (D) 僅提供數據視覺化功能。 不正確。 雖然 Keras 在訓練過程中可以顯示進度,並且可以透過整合其他函式庫(如 Matplotlib, TensorBoard)進行視覺化,但數據視覺化並非其主要或唯一功能。其核心價值在於深度學習模型的建構與訓練。 ::: 19. 在機器學習領域中,「特徵(Features)」的重要性體現在哪方面? (A) 僅影響模型的訓練速度。 (B) 是機器學習模型的輸入變量,代表資料的屬性或特性,也是模型用來進行預測的依據。 (C) 僅用於模型的最終輸出結果。 (D) 只有在非監督式學習中才需要特徵。 :::spoiler **答案** B ::: 20. 關於「特徵工程(Feature Engineering)」,下列敘述何者錯誤? (A) 它是利用領域知識建構所需特徵的過程。 (B) 其目的是使機器學習模型能夠更好地訓練與工作。 (C) 如果特徵選取得當,有助於模型有效萃取隱藏在資料中的規律。 (D) 它是機器學習方法中最簡單且最不需要創造性的部分。 :::spoiler **答案** D ::: 21. 企業在特徵選取時,應遵循的原則不包括下列哪一項? (A) 理解資料的內容。 (B) 評估特徵對模型性能的影響。 (C) 僅選擇與問題無關的隨機數據作為特徵。 (D) 根據評估結果不斷改進特徵。 :::spoiler **答案** C ::: 22. 「標籤(Labels)」在機器學習中扮演的角色是什麼? (A) 它是非監督式學習模型中唯一的輸入變量。 (B) 標籤僅用於資料的視覺化呈現。 (C) 標籤只見於監督式學習方法中,是模型產出的結果或已知的預期結果。 (D) 標籤是模型訓練過程中自動生成的資料。 :::spoiler **答案** C ::: 23. 在機器學習中,資料集通常會被分割成三個部分。下列何者不屬於這三個部分? (A) 訓練數據集。 (B) 備份數據集。 (C) 測試數據集。 (D) 驗證數據集。 :::spoiler **答案** B ::: 24. 訓練數據集在資料集分割中通常佔比多少,用於訓練機器學習模型? (A) 10-15%。 (B) 70-80%。 (C) 50%。 (D) 90%以上。 :::spoiler **答案** B 數據集分割與訓練數據集比例 在機器學習中,為了評估模型在未見過數據上的表現(即泛化能力),我們通常會將原始數據集分割成幾個部分,最常見的是: 訓練數據集 (Training Set): 這部分數據用於訓練機器學習模型,讓模型從中學習數據的模式、特徵和關聯性。 它是整個數據集中佔比最大的部分。 驗證數據集 (Validation Set): (可選,但在模型調整階段非常有用)這部分數據用於在訓練過程中調整模型超參數和防止過擬合。模型在驗證集上的表現,會指導我們如何改進模型。 測試數據集 (Test Set): 這部分數據是模型在訓練和調整過程中從未見過的數據。它用於對最終訓練好的模型進行最終評估,提供一個無偏估計的模型性能。 常見的數據集分割比例 在實際應用中,訓練數據集佔比的選擇取決於數據集的總大小、模型的複雜度以及問題的性質。然而,最常見且廣泛接受的訓練數據集比例通常為: 70% 到 80%:這是最典型的比例。例如,如果只分為訓練集和測試集,常見的是 70% 訓練 / 30% 測試,或 80% 訓練 / 20% 測試。 如果使用三方分割(訓練集、驗證集、測試集),則常見的比例可能是 60% 訓練 / 20% 驗證 / 20% 測試。 選項分析 (A) 10-15%:這通常是測試集或驗證集的比例,對於訓練集來說太小,不足以讓模型充分學習。 (B) 70-80%:這是訓練數據集的標準和推薦佔比,能夠讓模型從足夠的數據中學習,同時也保留了足夠的數據用於無偏評估。 (C) 50%:雖然技術上可行,但如果數據量不大,50% 可能不足以讓模型學習到複雜的模式;而對於大型數據集,這會導致驗證或測試集的數據量過大,效率較低。 (D) 90%以上:雖然訓練數據越多越好,但如果訓練集佔比過高(例如 90%以上),則留給測試集的數據就會非常少(不到 10%),這可能導致測試結果不夠可靠,無法充分反映模型在真實世界數據上的泛化能力。 ::: 25. 關於資料集分割的注意事項,下列敘述何者正確? (A) 分割操作應在數據清理後進行,不影響原始數據。 (B) 在分割前對數據進行隨機取樣,以確保數據在各個子集中的隨機分布。 (C) 驗證集和測試集應具有完全不同的分布,以測試模型的泛化能力。 (D) 重複交叉驗證會增加過擬合的風險。 :::spoiler **答案** B 資料集分割的注意事項解析 資料集分割是機器學習流程中的關鍵步驟,旨在為模型的訓練、驗證和最終評估提供獨立的數據集,以確保對模型泛化能力的無偏評估。 選項分析 (A) 分割操作應在數據清理後進行,不影響原始數據。 部分正確,但非最全面。 資料集分割確實應該在數據清理和預處理之後進行,以確保所有子集都具有相同的處理方式和數據品質。至於「不影響原始數據」,分割操作確實不會改變原始數據的內容,但它會將原始數據邏輯上劃分為不同的用途。然而,這句話並未觸及分割的核心原則。 (B) 在分割前對數據進行隨機取樣,以確保數據在各個子集中的隨機分布。 正確。 這是資料集分割中最關鍵的步驟之一。在將數據分割成訓練集、驗證集和測試集之前,必須先對數據進行隨機洗牌(Shuffling)或隨機取樣。這樣做的目的是確保每個子集都能代表原始數據集的整體分佈,避免由於數據本身的排序(例如,所有正例在前,所有負例在後)而導致某個子集過於集中於某種類型數據,從而引入偏差,影響模型的訓練效果和評估結果。 (C) 驗證集和測試集應具有完全不同的分布,以測試模型的泛化能力。 不正確。 驗證集、測試集(以及訓練集)都應該來自相同的底層數據分佈。如果驗證集和測試集的數據分佈與訓練集或真實世界的數據分佈「完全不同」,那麼模型在這些集合上的表現就無法真正反映其在實際應用中的泛化能力。泛化能力指的是模型在「未見過但來自相同分佈」的數據上的表現。 (D) 重複交叉驗證會增加過擬合的風險。 不正確。 恰恰相反,交叉驗證(Cross-validation)是一種用於減少模型過擬合到特定數據分割、並提供更穩健模型性能估計的技術。它透過多次將數據分割成訓練和驗證集來訓練和評估模型,從而獲得更可靠的性能指標,並幫助選擇最佳的模型或超參數,進而降低過擬合的風險。 ::: 26. 企業在收集機器學習資料時,應考慮多樣性、代表性、偏見和公平性。其中「解決偏見和公平性問題」對於建立AI系統至關重要的原因是? (A) 僅用於提高模型的訓練速度。 (B) 確保數據集平衡,不偏向任何特定群體,從而建立道德和無偏見的AI系統。 (C) 減少數據儲存成本。 (D) 方便資料的自動化標記。 :::spoiler **答案** B ::: 27. 下列何者是機器學習數據收集的主要挑戰之一? (A) 資料取得過於容易,導致數據量過大。 (B) 收集標記數據通常成本高昂,且數據可能存在品質問題和雜訊影響。 (C) 數據來源單一,導致模型過於簡單。 (D) 法律和道德考慮已完全解決,無需特別關注。 :::spoiler **答案** B ::: 28. 在房價預測模型中,房屋的實際價格屬於哪種機器學習概念? (A) 特徵。 (B) 標籤。 (C) 變量。 (D) 屬性。 :::spoiler **答案** B ::: 29. 在深度學習中,神經網路的人工神經元被稱為? (A) 節點。 (B) 連結。 (C) 軸突。 (D) 樹突。 :::spoiler **答案** A ::: 30. 在機器學習的「迴歸分析」中,其最終目標是什麼? (A) 將數據分群。 (B) 尋找數據之間的因果關係。 (C) 在數據之間繪製最佳擬合線或曲線。 (D) 僅限於處理類別型資料。 :::spoiler **答案** C 迴歸分析 (Regression Analysis) 的核心目標 迴歸分析 (Regression Analysis) 是一種機器學習(以及統計學)中常用的技術,其主要目的是建立一個模型來描述一個因變數(或目標變數,通常是連續數值型)與一個或多個自變數(或特徵變數)之間的關係。 這個關係通常會用一條「最佳擬合線」或「最佳擬合曲線」來表示,用以: 預測 (Prediction):根據自變數的值來預測因變數的數值。這是迴歸最常見的應用。 理解關係 (Understanding Relationship):分析自變數如何影響因變數,以及它們之間關係的強度和方向。 選項分析 (A) 將數據分群 (Clustering data): 不正確。 這是聚類分析 (Clustering Analysis) 的目標,屬於非監督式學習,目的是將相似的數據點自動歸為一組。迴歸是預測連續值,與分群不同。 (B) 尋找數據之間的因果關係 (Finding causal relationships between data): 不正確。 迴歸分析可以揭示變數之間的關聯性 (Correlation),但它本身不能直接證明因果關係 (Causation)。要建立因果關係通常需要更嚴格的研究設計,例如隨機對照實驗。迴歸是分析相關性,而非直接證明因果。 (C) 在數據之間繪製最佳擬合線或曲線 (Drawing the best-fit line or curve between data): 正確。 無論是簡單線性迴歸(尋找最佳直線)還是多項式迴歸或其他非線性迴歸模型(尋找最佳曲線),它們的最終目標都是要找到一條或一條曲線,能夠最好地描述自變數和因變數之間的數據點關係,從而能進行預測。這條線或曲線就是模型學習到的關係。 (D) 僅限於處理類別型資料 (Only limited to processing categorical data): 不正確。 迴歸分析主要用於處理連續型數值資料作為其因變數(預測目標)。處理類別型資料的任務是分類 (Classification)。 ::: # 5 - 鑑別式AI的原理與應用 1. 在人工智慧領域中,電腦視覺(Computer Vision)的主要目標是什麼? (A) 開發能自動翻譯語言的應用。 (B) 訓練AI應用能「看見」世界,透過處理圖像來實現。 (C) 專注於生成音樂和藝術作品。 (D) 僅限於處理結構化數據的分析。 :::spoiler **答案** B ::: 2. 在電腦中,圖像(Image)通常是如何表示的? (A) 以聲音波形陣列。 (B) 以圖元陣列(Pixel Array)表示,每個圖元包含顏色資訊。 (C) 以純文字檔案格式儲存。 (D) 以三維物體模型表示。 :::spoiler **答案** B ::: 3. 關於彩色數位圖像的圖元表示,下列敘述何者正確? (A) 彩色圖像通常只包含一個灰度通道。 (B) 彩色圖像大多是二維的,不含色彩資訊。 (C) 彩色圖像通常是三維的,含有代表紅色、綠色和藍色(RGB)的三個通道。 (D) 彩色圖像的圖元值範圍僅限於0到1。 :::spoiler **答案** C 彩色數位圖像的圖元表示 在數位圖像處理中,圖像是由許多微小的點構成,這些點被稱為圖元(Pixel)。每個圖元都帶有特定的顏色資訊。 對於彩色數位圖像,最常見且廣泛使用的顏色模型是 RGB 模型: R 代表 紅色 (Red) G 代表 綠色 (Green) B 代表 藍色 (Blue) 每個圖元由這三個基本顏色的強度值組合而成。這三個顏色通道獨立地儲存了每個圖元在紅、綠、藍光譜上的亮度資訊。 因此,從數據結構的角度來看,一個彩色圖像通常可以被視為一個三維的矩陣或張量: 第一個維度: 圖像的高度(像素行數) 第二個維度: 圖像的寬度(像素列數) 第三個維度: 顏色通道數,通常是 3(對應 RGB) 選項分析 (A) 彩色圖像通常只包含一個灰度通道。 不正確。 只包含一個灰度通道的是灰度圖像(或稱黑白圖像),它只表示光線的強度或亮度,沒有顏色資訊。 (B) 彩色圖像大多是二維的,不含色彩資訊。 不正確。 彩色圖像必然含有色彩資訊。雖然我們可以說圖像有長寬兩個空間維度,但為了儲存顏色,必須引入額外的顏色通道維度,使其在數據表示上成為三維。 (C) 彩色圖像通常是三維的,含有代表紅色、綠色和藍色(RGB)的三個通道。 正確。 這精確地描述了彩色圖像的標準數位表示方式。每個圖元由三個強度值構成,分別對應紅、綠、藍三個通道,共同決定了該圖元的最終顏色。 (D) 彩色圖像的圖元值範圍僅限於0到1。 不正確。 圖元值的範圍取決於圖像的位深度(bit depth)。最常見的 8 位元圖像,每個通道的圖元值範圍是 0 到 255。雖然在某些圖像處理或深度學習應用中,為了計算方便,會將圖元值正規化到 0 到 1 的範圍,但這並不是其「僅限於」的原始表示範圍。 ::: 4. 卷積運算(Convolution Operation)在影像處理中的關鍵作用是什麼? (A) 僅用於壓縮圖像檔案大小。 (B) 透過應用一個內核(濾波器)於圖像的每個圖元,結合周圍圖元的資訊來產生新的像素,實現模糊、銳化或邊緣檢測等效果。 (C) 專門用於圖像的自動分類。 (D) 僅用於調整圖像的亮度。 :::spoiler **答案** B 卷積運算 (Convolution Operation) 在影像處理中的作用 卷積運算 (Convolution Operation) 是數位影像處理和卷積神經網路 (CNN) 中的一個核心概念。它是一種數學運算,用於從圖像中提取特徵或應用各種視覺效果。 其工作原理可以簡述為: 內核(Kernel)或濾波器(Filter):一個小型的矩陣(通常是 3x3 或 5x5),其中包含一組權重值。 滑動 (Sliding):這個內核會在圖像上從左到右、從上到下地滑動。 計算 (Calculation):在內核覆蓋的每個圖像區域,將內核中的值與其對應的圖像圖元值進行逐元素相乘,然後將所有乘積相加。 產生新像素 (New Pixel Generation):這個求和的結果就是輸出圖像中對應位置的新圖元值。 透過這種方式,新產生的圖元包含了原始圖像中該圖元及其周圍圖元的資訊,從而實現各種效果。 選項分析 (A) 僅用於壓縮圖像檔案大小。 不正確。 卷積運算的主要目的不是壓縮圖像檔案大小。圖像壓縮通常涉及離散餘弦變換 (DCT) 或小波變換等技術。 (B) 透過應用一個內核(濾波器)於圖像的每個圖元,結合周圍圖元的資訊來產生新的像素,實現模糊、銳化或邊緣檢測等效果。 正確。 這精確地描述了卷積運算的核心機制和應用。不同的內核設計可以實現不同的效果: 模糊 (Blurring):使用平均值或高斯內核來平滑圖像,減少細節。 銳化 (Sharpening):使用強調邊緣的內核來增強圖像的細節。 邊緣檢測 (Edge Detection):使用特定的內核(如 Sobel, Prewitt)來突出圖像中亮度或顏色變化大的區域,從而識別邊緣。 (C) 專門用於圖像的自動分類。 不正確。 卷積運算是卷積神經網路 (CNN) 的基礎組成部分,而 CNN 常用於圖像自動分類。然而,卷積運算本身是一個底層的特徵提取操作,不是整個自動分類系統的最終功能。自動分類是整個 CNN 模型結合多個卷積層、池化層和全連接層後才實現的目標。 (D) 僅用於調整圖像的亮度。 不正確。 調整圖像亮度通常是透過簡單地對每個圖元值進行加減乘除運算來實現的,不需要卷積運算。 ::: 5. 在影像處理中,一個中間值為8、周圍值為-1的3x3篩選器內核(Filter Kernel)通常用於實現哪種效果? (A) 圖像模糊。 (B) 圖像銳化。 (C) 圖像邊緣檢測。 (D) 圖像色彩反轉。 :::spoiler **答案** C 此篩選器內核的運作原理與效果 給定的 3x3 篩選器內核如下: -1 -1 -1 -1 8 -1 -1 -1 -1 在卷積運算中,這個內核會: 將中心圖元的值乘以 8。 將周圍八個圖元的值各乘以 -1。 將這九個乘積結果相加,得到新圖元的值。 這個內核的特性是: 所有元素相加的總和為 (-1 * 8) + 8 = 0。 中心權重為正且較大,周圍權重為負。 當應用此內核時: 如果中心圖元與周圍圖元的亮度值差異不大(例如在圖像的平坦區域),那麼它們的負值和正值將會大致抵消,輸出值接近零或較小。 如果中心圖元與周圍圖元的亮度值存在顯著差異(例如在圖像的邊緣或細節處),那麼中心圖元的高正權重將會放大這種差異,同時周圍的負權重會進一步強調這種變化,使得邊緣或細節變得更加突出。 這種效果就是圖像銳化 (Image Sharpening)。它通過增加圖像中細節和邊緣的對比度來使圖像看起來更清晰。 選項分析 (A) 圖像模糊 (Image Blurring):模糊濾波器通常使用全部為正值且總和為 1 的內核(例如,平均濾波器),目的是平均周圍圖元的值,以平滑圖像。 (B) 圖像銳化 (Image Sharpening):如上述分析,此內核是典型的銳化濾波器,透過強調圖元與其周圍的差異來增強邊緣和細節。 (C) 圖像邊緣檢測 (Image Edge Detection):邊緣檢測濾波器(例如 Sobel 或 Laplacian 濾波器)通常旨在找到圖像中亮度變化最大的位置,其內核通常也包含正負值,且總和為 0,但它們的權重分佈是為精確定位邊緣而設計的,例如偵測水平或垂直邊緣。此處的內核更通用於銳化。 (D) 圖像色彩反轉 (Image Color Inversion):色彩反轉是一種簡單的像素級運算,通常是將每個圖元的值從最大值中減去(例如 255 - pixel_value),不涉及卷積內核。 考點解析 這個問題的考點在於理解卷積運算中不同「濾波器內核」的設計及其對圖像產生的效果。這是數位影像處理和卷積神經網路 (CNN) 基礎中的核心概念。特別是: 內核的權重如何影響圖像處理結果。 不同類型的濾波器(如平滑/模糊、銳化、邊緣檢測)所使用的內核特徵。 理解卷積層如何在 CNN 中進行特徵提取。 掌握這些知識有助於理解圖像在經過卷積處理後,其視覺特徵如何被強化或改變。 ::: 6. 卷積神經網路(CNN)在電腦視覺領域中,其訓練過程中的篩選器內核權重是如何調整的? (A) 初始固定不變,後期手動調整。 (B) 初始基於隨機權重,隨後根據模型的預測結果進行調整,以提高準確性。 (C) 透過人工智慧專家手動設定所有權重。 (D) 僅在模型訓練結束後一次性調整。 :::spoiler **答案** B ::: 7. 多模態模型(Multimodal Model)的主要創新之處是什麼? (A) 僅處理單一類型的數據,如純文本。 (B) 結合圖像和文本資料,使用帶有描述性文本的圖像進行訓練。 (C) 專注於生成新的創意內容,而非理解現有內容。 (D) 僅限於處理時間序列數據。 :::spoiler **答案** B ::: 8. Microsoft Florence作為一種先進的多模態模型,其主要應用之一是什麼? (A) 專門用於生成法律文件。 (B) 作為基礎模型,用於構建針對各種專業任務的自我調整模型,如圖像分類和物件偵測。 (C) 僅用於進行語音辨識。 (D) 專門用於財務數據分析。 :::spoiler **答案** B ::: 9. Azure AI 視覺服務(Azure AI Vision Service)提供了哪些主要功能? (A) 僅提供文字翻譯服務。 (B) 提供光學字元辨識(OCR)、影像分類、物件偵測等電腦視覺功能。 (C) 僅用於生成新的音樂作品。 (D) 專注於資料庫管理。 :::spoiler **答案** B ::: 10. 數位資產管理(DAM)中,Azure AI 視覺服務可以提供哪些幫助? (A) 僅用於管理數位權利和許可證。 (B) 幫助企業根據可見標誌、臉部、物件和色彩等特徵來分組和識別影像,並自動生成標題和關鍵詞。 (C) 僅用於儲存和檢索豐富的媒體資產。 (D) 專門用於影像壓縮和解壓縮。 :::spoiler **答案** B ::: 11. 光學字元辨識(OCR)技術的主要目的為何? (A) 僅用於將手寫文字轉換為語音。 (B) 利用機器學習技術從影像中提取文字,並將其轉換為數位文本。 (C) 專門用於影像的色彩分析。 (D) 僅用於檢測影像中的物體。 :::spoiler **答案** B ::: 12. Azure AI 視覺的讀取API(Read API)作為一種高級OCR工具,其工作原理有何特點? (A) 只能處理印刷體文字,無法處理手寫文字。 (B) 自動判斷要使用的適當辨識模型,考量影像中的文字行數、文字內容以及手寫文字等因素。 (C) 僅提供文字的有無判斷,不提供具體文字內容。 (D) 僅支持英文,無法處理其他語言。 :::spoiler **答案** B ::: 13. 文件辨識(Document Recognition)服務是如何實現自動化處理各類文件的? (A) 僅透過人工手動輸入資料。 (B) 透過訓練有素的機器學習模型,能夠識別和提取文本、佈局及鍵值對。 (C) 僅限於處理圖片文件,無法處理文字。 (D) 專門用於將文件翻譯成不同語言。 :::spoiler **答案** B ::: 14. Azure AI 文件辨識服務的三大類模型不包括下列哪一項? (A) 預生成模型。 (B) 自訂模型。 (C) 影像生成模型。 (D) 文件分析。 :::spoiler **答案** C Azure AI 文件辨識服務(Document Intelligence)的三大類模型 Azure AI 文件辨識服務(舊稱 Form Recognizer)是一個雲端服務,旨在透過 AI 技術從文件和表單中自動擷取文字、結構和數據。它主要提供以下三種類型的模型: 預建模型 (Prebuilt Models) 簡介:這些是由 Microsoft 預先訓練好的模型,可以直接使用,無需額外訓練。它們針對常見的文件類型進行優化,例如發票、收據、身分證件、名片、合約和健康保險卡等。 用途:適用於標準化或半標準化的文件,可以快速部署以從這些文件中提取關鍵資訊。 自訂模型 (Custom Models) 簡介:如果您的文件具有獨特的佈局、行業特定或高度客製化的格式,預建模型可能無法滿足需求。自訂模型允許您使用自己的文件樣本進行訓練,以建立針對特定文件類型和數據擷取需求的模型。自訂模型又分為: 自訂範本模型 (Custom Template Models):適用於結構化或半結構化的固定版面文件(如申請表)。 自訂神經網路模型 (Custom Neural Models):適用於非結構化或自由格式的文件(如合約、信件),這些模型更靈活,能處理版面變異較大的文件。 自訂分類模型 (Custom Classification Models):用於識別和分類輸入文件屬於哪種預先定義的類型,特別適用於處理包含多種類型文件的批次或複合文件。 用途:用於處理高度客製化或特定於業務流程的文件,需要使用者提供帶有標籤的訓練數據。 文件分析模型 (Document Analysis Models) 簡介:這是一組基礎模型,提供文件級的通用分析功能,通常是所有其他模型(包括預建和自訂模型)的基礎。主要包括: 讀取 (Read):用於高精度地從文件中擷取所有印刷和手寫文字。 版面配置 (Layout):除了擷取文字外,還能識別文件的結構元素,如表格、選取標記、段落、標題等。 一般文件 (General Document):結合讀取和版面配置功能,從各種通用文件中提取文字、結構和鍵值組。 用途:提供底層的光學字元辨識 (OCR) 和文件結構理解能力,可以作為獨立的 API 呼叫,也可以作為更複雜模型管道的一部分。 選項分析 (A) 預生成模型:這是 Azure AI 文件辨識服務提供的主要模型類別之一。 (B) 自訂模型:這是 Azure AI 文件辨識服務提供的主要模型類別之一。 (C) 影像生成模型:這類模型(如 GANs 或擴散模型)用於從文本描述或其他輸入生成新的圖像,例如 DALL-E 或 Midjourney。這與文件辨識服務的核心功能(即從現有文件中提取資訊)無關。 (D) 文件分析:這代表了一組基礎模型(如讀取、版面配置)和服務核心能力,用於解析文件內容,屬於服務提供模型功能的一部分。 ::: 15. 臉部偵測(Face Detection)在人臉分析中的作用是什麼? (A) 識別圖像中的人臉並用邊界框標記,標明人臉的確切位置。 (B) 僅用於識別個人的身份。 (C) 專門用於生成新的人臉圖像。 (D) 僅用於分析臉部的情緒。 :::spoiler **答案** A ::: 16. 臉部識別(Face Recognition)技術是如何實現識別特定個體的? (A) 僅透過分析單一圖像的亮度。 (B) 透過訓練機器學習模型,使用個人的多張圖像來提高識別準確性。 (C) 僅依賴於人臉的模糊度評估。 (D) 專注於生成不同人臉的變體。 :::spoiler **答案** B ::: 17. 在臉部辨識系統中,「PersonGroup」或「LargePersonGroup」的用途是什麼? (A) 用於儲存和管理一組人員的資料結構。 (B) 僅用於記錄單一圖像的識別結果。 (C) 專門用於調整圖像的亮度。 (D) 僅用於評估人臉的清晰度。 :::spoiler **答案** A 「PersonGroup」與「LargePersonGroup」在臉部辨識系統中的用途 在許多臉部辨識服務(例如 Microsoft Azure Face API 或其他類似的臉部辨識平台)中,「PersonGroup」和「LargePersonGroup」是核心的資料結構,用於組織和管理需要被辨識的人物資料。 這些結構的主要目的是: 儲存人物身份資訊:每個 Person 物件代表一個真實世界中的人,可以包含該人物的 ID、姓名等元數據。 儲存人臉特徵向量:將這個人多張臉部圖像的特徵向量(Face Feature Vectors)儲存起來。這些特徵向量是從照片中提取的、用於唯一識別該人臉的數學表示。 用於臉部辨識訓練:當一個 PersonGroup 或 LargePersonGroup 被建立並填充了多個人的臉部數據後,系統會對其進行訓練。訓練的目的是讓模型學習如何區分這些不同的人物。 執行「識別」(Identification)操作:當系統接收到一張新的人臉圖像時,它可以將這張人臉與 PersonGroup 或 LargePersonGroup 中訓練過的人物進行比對,判斷這張臉屬於哪一位已註冊的人。 PersonGroup:通常用於管理相對較少數量的人員(例如幾十到幾千人)。 LargePersonGroup:用於管理更大規模的人員數量,可以達到百萬級別。 選項分析 (A) 用於儲存和管理一組人員的資料結構。 正確。 這精確地描述了 PersonGroup 和 LargePersonGroup 的核心功能。它們是為「識別人」(Identification)目的而設計的容器,將多個個體的人臉特徵歸類和組織起來。 (B) 僅用於記錄單一圖像的識別結果。 不正確。 這些結構是用於儲存「已知人物」的資料以供未來識別,而不是單純記錄某次識別的結果。單一圖像的識別結果是針對輸入圖像的輸出。 (C) 專門用於調整圖像的亮度。 不正確。 調整圖像亮度是圖像處理的基本功能,與臉部辨識系統中管理人物身份的資料結構無關。 (D) 僅用於評估人臉的清晰度。 不正確。 評估人臉清晰度是臉部偵測(Face Detection)或品質檢查的一部分,旨在確保輸入圖像適合進行辨識。這與 PersonGroup 作為人物數據管理容器的用途不同。 ::: 18. 提高圖像偵測準確性的關鍵因素中,不包括下列哪一項? (A) 圖片格式應為JPEG、PNG、GIF、BMP之一。 (B) 圖片檔案大小應小於6MB。 (C) 人臉大小範圍應在36x36像素至4096x4096像素之間。 (D) 極端的人臉角度和強烈的光照條件。 :::spoiler **答案** D ::: 19. Azure Video Indexer作為微軟的影片索引器雲端應用程式,其主要功能之一是什麼? (A) 僅提供影片剪輯和編輯功能。 (B) 透過影片與音訊模型分析影片和音訊內容,從中擷取重要資訊並產生豐富的深入解析。 (C) 專門用於生成新的影片內容。 (D) 僅用於影片的儲存和分享。 :::spoiler **答案** B ::: 20. Azure AI 視覺服務中,「智慧裁剪縮圖(Smart Cropping Thumbnails)」功能的運作方式為何? (A) 僅將圖像縮小,不考慮內容。 (B) 移除影像中的雜亂元素,找出主要物體所在區域,並根據識別出的「主要物體區域」來裁剪影像,調整影像比例。 (C) 隨機裁剪圖像,生成不同尺寸的縮圖。 (D) 僅裁剪圖像的邊緣,不影響中心內容。 :::spoiler **答案** B ::: 21. 電腦視覺中的「物件偵測(Object Detection)」與「圖像分類(Image Classification)」的主要區別是什麼? (A) 物件偵測僅識別圖像類別,圖像分類識別物體位置。 (B) 物件偵測識別圖像中的物件及其位置,圖像分類將圖像分類到不同類別中。 (C) 兩者功能完全相同,沒有區別。 (D) 物件偵測僅處理黑白圖像,圖像分類處理彩色圖像。 :::spoiler **答案** B ::: 22. Azure AI 視覺服務中的「審核敏感內容(Sensitive Content Moderation)」功能,能夠偵測圖像中哪些類型的敏感內容? (A) 僅限於成人內容。 (B) 成人影像、猥褻影像、暴力畫面。 (C) 僅限於版權受保護的內容。 (D) 僅限於低解析度圖像。 :::spoiler **答案** B ::: 23. 在文件辨識中,預生成的模型(Pre-generated Models)主要適用於哪些文件類型? (A) 僅限於手寫文件。 (B) 針對常見文件類型進行預訓練,以識別關鍵字段,如餐飲帳單、銀行對帳單、身份證件等。 (C) 僅限於加密文件。 (D) 專門用於複雜的技術文檔。 :::spoiler **答案** B ::: 24. 在人臉分析中,「臉部模糊度評估(Face Blur Assessment)」功能的主要用途是什麼? (A) 僅用於調整圖像的焦距。 (B) 能夠分析影像中臉部的清晰度,並提供數值和評估值。 (C) 專門用於偵測人臉的情緒。 (D) 僅用於增加圖像的顆粒感。 :::spoiler **答案** B ::: 25. 影片索引器雲端應用程式(Azure Video Indexer)中,其提供的「協助工具(Accessibility)」功能主要包括什麼? (A) 僅提供影片播放速度調整。 (B) 提供多種語言轉譯和翻譯功能,將內容給行動不便或不同語言地區的人士輕鬆理解和使用。 (C) 僅用於影片的版權保護。 (D) 專門用於自動生成影片內容。 :::spoiler **答案** B ::: 26. 在圖像處理中,使用濾波器內核(Filter Kernel)修改圖像時,新的像素值有時會超出0到255的標準範圍,此時需要進行什麼處理? (A) 刪除超出範圍的像素。 (B) 調整以適應該範圍。 (C) 不做任何處理,保留原始值。 (D) 重新計算圖像的解析度。 :::spoiler **答案** B ::: 27. 關於卷積神經網路(CNN)的應用,下列敘述何者正確? (A) 僅用於自然語言處理。 (B) 僅用於圖像壓縮。 (C) 廣泛應用於圖像處理和物體檢測,並能識別和定位多個物體類別。 (D) 無法處理連續圖片的特徵。 :::spoiler **答案** C ::: 28. 在Azure AI 視覺服務中,「背景移除(Background Removal)」功能是如何實現的? (A) 僅透過剪裁圖像的邊緣。 (B) 通過創建前景物體的Alpha遮罩,並使用該遮罩返回前景或背景。 (C) 僅透過改變背景顏色。 (D) 隨機選擇並刪除背景像素。 :::spoiler **答案** B ::: 29. 在人臉分析的「關鍵屬性偵測(Key Attribute Detection)」中,「遮擋(Occlusion)」功能主要識別什麼? (A) 識別圖像中是否有物體遮蔽臉部的部分,如眼睛、額頭和嘴巴。 (B) 識別臉部是否模糊。 (C) 識別臉部的曝光狀況。 (D) 識別臉部佩戴的配件。 :::spoiler **答案** A ::: 30. 在製造業中,使用自訂電腦視覺模型(Custom Computer Vision Model)進行瑕疵缺陷檢測,其目的為何? (A) 僅用於統計生產數量。 (B) 在工廠生產線上,利用自訂電腦視覺模型來檢測產品的瑕疵或缺陷。 (C) 專門用於調整生產線速度。 (D) 僅用於生成新的產品設計。 :::spoiler **答案** B ::: # 6 - 生成式AI的原理與應用 1. 自然語言處理(NLP)在人工智慧領域中的主要目標是什麼? (A) 使電腦能夠執行物理任務,如機器人操作。 (B) 使電腦能夠理解和回應人類語言。 (C) 專注於開發電腦遊戲。 (D) 僅限於處理圖像資料。 :::spoiler **答案** B ::: 2. Azure AI 語言服務主要提供哪一方面的功能,以幫助用戶理解和分析文本? (A) 影片編輯。 (B) 自然語言處理 (NLP)。 (C) 數據庫管理。 (D) 網路安全。 :::spoiler **答案** B ::: 3. 情感分析(Sentiment Analysis)的核心功能是什麼? (A) 將語音轉換為文字。 (B) 分析文本中的情感或情緒。 (C) 自動生成新聞報導。 (D) 僅限於識別文本中的關鍵字。 :::spoiler **答案** B ::: 4. 在人工智慧應用中,AI 翻譯技術被提及可提升汽車保養廠維修技師的工作效率,這屬於哪種自然語言處理技術的應用? (A) 情感分析。 (B) 機器翻譯。 (C) 文本摘要。 (D) 關鍵片語擷取。 :::spoiler **答案** B ::: 5. REST API 的設計風格是基於哪種協議,允許開發者通過標準請求訪問和操作網路資源? (A) FTP。 (B) SMTP。 (C) HTTP。 (D) TCP/IP。 :::spoiler **答案** C ::: 6. 在自然語言處理中,關於關鍵片語(Keywords)和實體(Entities)的敘述,下列何者正確? (A) 關鍵片語是具名實體,實體是抽象概念。 (B) 關鍵片語代表文本核心內容和主題,實體是具特定意義的詞語或短語(如人名、地名)。 (C) 兩者功能完全相同,沒有區別。 (D) 關鍵片語用於語音識別,實體用於文本翻譯。 :::spoiler **答案** B 答案是 (B) 關鍵片語代表文本核心內容和主題,實體是具特定意義的詞語或短語(如人名、地名)。 自然語言處理中的關鍵片語與實體 在自然語言處理(NLP)領域,理解文本內容是核心任務之一。其中,「關鍵片語」和「實體」是兩種不同的概念,用於從文本中提取不同層次的資訊: 關鍵片語 (Keywords / Key Phrases): 定義:指的是文本中能夠概括主要內容、主題或中心思想的詞語或短語。它們不一定是專有名詞,可能是普通名詞、動詞短語等,但它們對於理解文本的重點至關重要。 目的:用於快速掌握文章的大意、內容摘要、建立索引或進行主題分類。例如,在一篇新聞報導中,關鍵片語可能是「經濟成長」、「利率調整」、「政策影響」等。 實體 (Entities): 定義:指的是文本中具有明確、可識別意義的具體「事物」。在 NLP 中,這通常指的是具名實體 (Named Entities),例如: 人名 (Person: 李小明、Tim Cook) 地名 (Location: 台北、紐約、艾菲爾鐵塔) 組織名 (Organization: Google、台灣大學、聯合國) 日期 (Date: 2025年7月6日、下週二) 時間 (Time: 上午十點、晚餐時間) 金額 (Money: 100美元、新台幣五百元) 百分比 (Percentage: 99%) 等。 目的:用於資訊提取、知識圖譜構建、問題回答系統、關係提取等,因為實體代表了文本中具體的參與者或對象。 選項分析 (A) 關鍵片語是具名實體,實體是抽象概念。 不正確。 關鍵片語不一定是具名實體(雖然有些關鍵片語可能恰好是實體),而實體是具體的「事物」,並非抽象概念。 (B) 關鍵片語代表文本核心內容和主題,實體是具特定意義的詞語或短語(如人名、地名)。 正確。 這個敘述精確地定義了關鍵片語和實體的不同作用與性質。關鍵片語著重於主題概括,而實體著重於識別具體的專有名詞或數值資訊。 (C) 兩者功能完全相同,沒有區別。 不正確。 如上述說明,兩者在 NLP 中扮演不同的角色,用於提取不同類型的資訊。 (D) 關鍵片語用於語音識別,實體用於文本翻譯。 不正確。 關鍵片語和實體都是文本分析的技術,雖然它們的結果可能間接用於語音識別(例如作為語義提示)或文本翻譯(例如確保專有名詞的正確翻譯),但這不是它們的「主要用途」或專屬領域。它們是針對文字內容本身進行分析。 ::: 7. 實體連結(Entity Linking)技術的主要目的是什麼? (A) 僅用於壓縮文本檔案。 (B) 將文本中的實體連結到對應的維基百科頁面,提供更多背景訊息。 (C) 專門用於生成新的文本內容。 (D) 僅限於識別文本中的語法錯誤。 :::spoiler **答案** B 實體連結(Entity Linking)技術的主要目的 實體連結 (Entity Linking),也稱為實體消歧 (Entity Disambiguation) 或實體規範化 (Entity Normalization),是自然語言處理 (NLP) 中的一項重要任務。它的主要目標是: 識別文本中的實體提及 (Entity Mentions):找出文本中所有可能指向真實世界實體的詞語或短語。 消歧 (Disambiguation):解決一詞多義的問題。例如,「蘋果」可能指蘋果公司,也可能指蘋果水果。實體連結需要判斷在特定語境中,「蘋果」到底指的是哪一個實體。 連結到知識庫 (Linking to Knowledge Base):將這些識別並消歧後的實體提及,連結到一個外部的、結構化的知識庫(如維基百科、DBpedia、Freebase 或企業內部的知識庫)中對應的唯一條目或識別符。 透過將文本中的實體與知識庫中的條目建立連結,實體連結技術能夠: 豐富資訊:為文本中的實體提供更豐富的背景知識和相關資訊。 語義理解:幫助機器更好地理解文本的語義,而不僅僅是字面意思。 數據整合:實現不同文本來源之間關於同一實體的數據整合。 資訊檢索與問答:提高搜尋結果的相關性,並支持更精確的問答系統。 ::: 8. 健康情況文字分析服務主要應用於哪種類型的文本資料? (A) 財務報告。 (B) 法律文件。 (C) 醫學資訊,如醫師筆記、出院摘要、臨床文件及電子健康記錄。 (D) 行銷文案。 :::spoiler **答案** C ::: 9. 在自訂文字分類中,如果每個文件只能被歸類為一個明確的類別,例如將產品檢查報告分類為「合格」或「不合格」,這屬於哪種類型的專案? (A) 多重標籤分類。 (B) 單一標籤分類。 (C) 聚類分析。 (D) 強化學習。 :::spoiler **答案** B 自訂文字分類的專案類型 文字分類是自然語言處理(NLP)中的一項核心任務,旨在將文本資料歸類到預先定義的類別中。根據每個文本可以被分配的類別數量,文字分類專案通常分為兩種主要類型: 單一標籤分類 (Single-label Classification): 定義:每個文本實例只能且必須被歸類到一個且僅一個類別。類別之間通常是互斥的。 範例: 將郵件分類為「垃圾郵件」或「非垃圾郵件」。 將情感文本分類為「正面」、「負面」或「中性」。 將新聞文章分類為「政治」、「體育」或「財經」。 將產品檢查報告分類為「合格」或「不合格」,正如題目所述。 特點:模型輸出的是一個單一的類別預測。 多重標籤分類 (Multi-label Classification): 定義:每個文本實例可以被歸類到一個或多個類別。類別之間不是互斥的,一個文本可能同時屬於多個類別。 範例: 一篇電影評論可能同時被標記為「喜劇」、「動作」和「冒險」。 一份客戶意見回饋可能同時涉及「產品功能問題」和「客戶服務不佳」。 一張圖片可能同時包含「狗」、「樹」和「人」。 特點:模型輸出的是多個類別的預測,每個類別都有自己的置信度。 選項分析 (A) 多重標籤分類。 不正確。 多重標籤分類允許一個文件屬於多個類別,而題目明確指出「每個文件只能被歸類為一個明確的類別」。 (B) 單一標籤分類。 正確。 題目描述的情境——產品報告被歸類為「合格」或「不合格」,且每個報告只能有一個結果——完全符合單一標籤分類的定義。 (C) 聚類分析 (Clustering)。 不正確。 聚類分析是一種無監督學習方法,旨在將相似的數據點自動分組,而無需預先定義類別。文字分類是監督學習,需要預先定義好類別並進行訓練。 (D) 強化學習 (Reinforcement Learning)。 不正確。 強化學習是一種機器學習範式,代理人在環境中透過試錯學習,以最大化獎勵。這與文字分類的任務性質不同。 ::: 10. 自訂具名實體辨識(Custom NER)在 Azure AI 語言中的主要功能是什麼? (A) 自動翻譯文本。 (B) 從非結構化文本中提取特定實體類別,建立自訂AI模型。 (C) 僅限於情感分析。 (D) 自動生成圖像。 :::spoiler **答案** B ::: 11. 個人識別資訊(PII)和健康情況資訊(PHI)偵測技術的主要目的為何? (A) 提高文本可讀性。 (B) 自動識別並分類文本中的敏感訊息,確保數據隱私和安全。 (C) 僅用於將手寫文字轉換為數位文本。 (D) 專門用於生成新的藝術作品。 :::spoiler **答案** B ::: 12. 語言偵測(Language Detection)功能主要用於什麼? (A) 翻譯文本。 (B) 判斷文本的情感傾向。 (C) 偵測撰寫文件時所使用的語言。 (D) 提取文本中的關鍵片語。 :::spoiler **答案** C ::: 13. 長短期記憶網路(LSTM)作為一種特殊的遞歸神經網絡(RNN),其主要特點是什麼? (A) 僅處理圖像資料。 (B) 無法處理序列數據。 (C) 能夠有效地記住長期依賴關係,適合處理序列數據。 (D) 專門用於生成新的創意內容。 :::spoiler **答案** C ::: 14. Transformer 模型的核心組成部分是什麼? (A) 只有輸入層和輸出層。 (B) 編碼器、解碼器和自注意力機制。 (C) 僅限於卷積層。 (D) 只有遞歸單元。 :::spoiler **答案** B Transformer 模型簡介 Transformer 模型是 2017 年由 Google Brain 團隊提出的一種深度學習架構,它徹底改變了自然語言處理 (NLP) 領域,並且是當前許多先進生成式 AI 模型(如 GPT 系列、BERT 等)的基礎。它的提出解決了傳統序列模型的一些限制,特別是處理長序列數據的能力。 Transformer 的核心突破在於**「自注意力機制」(Self-Attention Mechanism)**。 選項分析 (A) 依賴傳統遞歸神經網路(RNN)處理序列數據。 不正確。 這恰恰是 Transformer 與傳統 RNN (如 LSTM、GRU) 的主要區別和最大優勢所在。RNN 依賴於序列的遞歸處理,前一個時間步的輸出是下一個時間步的輸入,這導致它難以進行並行計算,並且在處理長序列時容易出現梯度消失/爆炸的問題,難以捕捉遠距離的依賴關係。Transformer 正是為了克服這些限制而設計的,它完全摒棄了遞歸結構。 (B) 透過自注意力機制,能夠高效並行處理長序列數據和複雜的語言結構。 正確。 這完美地描述了 Transformer 的核心優勢: 自注意力機制: 允許模型在處理序列中的某個詞時,同時考慮序列中所有其他詞的重要性(權重),從而捕捉到詞語之間的遠距離依賴關係,無論它們在序列中相距多遠。 高效並行處理: 由於自注意力機制不再依賴於前一個時間步的輸出,而是可以同時計算所有詞語的注意力權重,這使得 Transformer 在訓練時能夠實現高度並行化,大大加快了訓練速度,尤其是在處理長序列時。 處理複雜語言結構: 自注意力機制讓模型能夠更好地理解複雜的語法結構和上下文語義。 (C) 僅用於圖像分類,不適用於自然語言處理。 不正確。 Transformer 模型最初是為自然語言處理 (NLP) 設計的,在機器翻譯、文本摘要、問答系統等方面取得了巨大成功。雖然它後來也被應用於電腦視覺(例如 ViT, Vision Transformer),但說它「僅用於圖像分類」且「不適用於 NLP」是完全錯誤的。 (D) 不需要大量數據訓練即可達到高性能。 不正確。 相反,Transformer 模型通常需要非常大量的數據進行訓練才能發揮其潛力,特別是那些達到頂級性能的大型語言模型。它們的強大性能很大程度上是建立在龐大數據集的基礎上。 ::: 15. 生成式 AI(Generative AI)最根本的特性是什麼? (A) 僅能識別現有數據中的模式。 (B) 能夠生成新內容,如文字、圖像或程式碼。 (C) 專注於分類和回歸問題。 (D) 需要明確的指令才能執行任務。 :::spoiler **答案** B ::: 16. 大型語言模型(LLM)的訓練數據主要來源是什麼? (A) 僅限於結構化數據庫。 (B) 僅限於人工標記的少量數據。 (C) 多種來源,包括書籍、文章、網頁和影像等。 (D) 僅限於語音記錄。 :::spoiler **答案** C ::: 17. 在大型語言模型(LLM)中,令牌(Token)的定義是什麼? (A) 指的是模型的總參數數量。 (B) 指的是 LLM 用來處理和生成文本的基本單位。 (C) 指的是模型的訓練時間。 (D) 指的是模型輸出結果的準確性。 :::spoiler **答案** B ::: 18. 「提示工程(Prompt Engineering)」在生成式 AI 應用中的主要目的是什麼? (A) 增加模型的訓練數據量。 (B) 優化提示以提升 AI 輸出品質。 (C) 僅用於調整模型的學習率。 (D) 降低模型的複雜度。 :::spoiler **答案** B ::: 19. 關於生成式預訓練變換器(GPT)模型的能力,下列敘述何者正確? (A) 僅限於語音識別。 (B) 在解析和生成自然語言任務上展現卓越能力。 (C) 僅用於圖像壓縮。 (D) 無法理解用戶輸入。 :::spoiler **答案** B ::: 20. OpenAI 的 GPT 模型在程式碼生成方面,尤其擅長哪種程式語言? (A) Java。 (B) C++。 (C) Python。 (D) Ruby。 :::spoiler **答案** C ::: 21. 圖像生成模型(如 DALL-E)能夠執行哪些功能? (A) 僅能對圖像進行分類。 (B) 僅能分析圖像中的文字。 (C) 利用文本提示或原圖創建新視覺作品,並能進行修改和生成變體。 (D) 僅限於影片編輯。 :::spoiler **答案** C ::: 22. 語音辨識技術的核心目標是什麼? (A) 將文字轉換為語音。 (B) 將口語轉換為機器可處理的資料(轉錄文本)。 (C) 僅用於分析音樂。 (D) 專注於生成新的音效。 :::spoiler **答案** B ::: 23. 語音合成(Text-to-Speech)技術的主要依賴因素是什麼? (A) 說話者的情緒。 (B) 文本內容和選定的朗讀聲音。 (C) 背景噪音。 (D) 語音的音量。 :::spoiler **答案** B ::: 24. Azure AI 翻譯工具(Translator Tool Service)支援哪些主要功能? (A) 僅限於圖片編輯。 (B) 文字翻譯、文件翻譯和自訂翻譯。 (C) 僅限於語音辨識。 (D) 數據庫管理。 :::spoiler **答案** B ::: 25. 在生成式 AI 領域中,Microsoft Copilot 的主要目標是什麼? (A) 僅用於圖像生成。 (B) 提升工作智慧、效率和創造力,通過自然語言處理與 Microsoft 必應結合。 (C) 專門用於管理數據庫。 (D) 僅限於學術研究。 :::spoiler **答案** B ::: 26. 在規劃負責任的生成式 AI 解決方案時,Microsoft 建議的第一個步驟是什麼? (A) 立即部署解決方案。 (B) 識別解決方案的潛在風險。 (C) 僅評估解決方案的成本效益。 (D) 忽略用戶回饋。 :::spoiler **答案** B ::: 27. 在緩解生成式 AI 潛在危害的策略中,「紅隊」測試(Red Teaming)的目的是什麼? (A) 僅用於測試模型訓練速度。 (B) 類比攻擊者視角探索系統弱點,嘗試產生有害結果。 (C) 專門用於優化用戶介面。 (D) 僅用於收集用戶回饋。 :::spoiler **答案** B ::: 28. 抽象式摘要(Abstractive Summarization)與擷取式摘要(Extractive Summarization)的主要區別是什麼? (A) 抽象式摘要僅從原文中提取句子,擷取式摘要生成新句子。 (B) 抽象式摘要生成新句子總結原文內容,擷取式摘要透過選取原文中顯著的句子來產生摘要。 (C) 兩者功能完全相同,沒有區別。 (D) 抽象式摘要用於語音,擷取式摘要用於文字。 :::spoiler **答案** B ::: 29. 在 Language Studio 平台中,開發者無需撰寫程式碼即可開始使用,這是因為其提供什麼樣的使用體驗? (A) 僅支援高階程式語言。 (B) 無需程式碼的使用體驗。 (C) 需要複雜的程式設計背景。 (D) 僅限於資料庫操作。 :::spoiler **答案** B Language Studio 平台的使用體驗 Language Studio 是 Microsoft Azure 提供的一個基於 Web 的平台,旨在讓開發者和數據科學家能夠更輕鬆地使用 Azure AI 語言服務,而無需深入的程式設計知識。其核心設計理念是提供一個直觀且高效的界面,讓使用者能夠: 探索和學習:了解 Azure AI 語言服務的功能。 建構和設定:建立、訓練和部署自訂的語言模型(例如自訂文本分類、命名實體辨識等)。 測試和驗證:對模型進行測試,評估其性能。 選項分析 (A) 僅支援高階程式語言。 不正確。 Language Studio 的主要優勢正是降低了對程式設計語言的依賴,使得非程式設計師也能使用。雖然底層服務可以通過程式碼(如 Python, C#, REST API)調用,但平台本身不要求使用者撰寫程式碼。 (B) 無需程式碼的使用體驗。 正確。 題目中明確提到「開發者無需撰寫程式碼即可開始使用」,這正是「無需程式碼」(No-code)或低程式碼(Low-code)平台的特點。Language Studio 提供了圖形使用者介面(GUI),讓使用者透過點擊、拖曳等操作來完成任務。 (C) 需要複雜的程式設計背景。 不正確。 這與 Language Studio 旨在降低使用門檻的目標相悖。它正是為了讓不具備複雜程式設計背景的人也能利用 AI 語言服務而設計的。 (D) 僅限於資料庫操作。 不正確。 Language Studio 專注於自然語言處理相關的服務,例如文本分析、語言理解、文本翻譯等,而非僅限於資料庫的管理或操作。 ::: 30. 大型語言模型(LLM)與傳統語言模型相比,其主要不同點在於什麼? (A) 傳統語言模型處理能力更強。 (B) LLM 通過更大規模的數據和更深層的神經網絡結構,能夠處理更複雜的語言任務。 (C) LLM 僅限於處理單一語言。 (D) 傳統語言模型需要更多計算資源。 :::spoiler **答案** B ::: # 7 - 企業導入AI策略 1. 企業導入AI的「構想階段」主要目的是什麼? (A) 模型開發與部署。 (B) 挑選合適AI方案。 (C) 計算投資回報率(ROI)。 (D) 持續發揮AI導入價值。 :::spoiler **答案** B ::: 2. 在企業導入AI的「構想階段」中,「掌握企業課題」包含哪些步驟? (A) 模型建置與運作模式。 (B) 經營目標明確化、選定應用範圍、提取改善項目、AI必要性。 (C) 數據完整性與一致性。 (D) 方案落地與AI價值擴散。 :::spoiler **答案** B ::: 3. 企業在「構想階段」評估AI方案時,對「檢視企業資源」的考量面向不包括下列何者? (A) 數位化程度。 (B) 人力資源。 (C) 預算與時間。 (D) 產品行銷策略。 :::spoiler **答案** D ::: 4. 在企業導入AI的「設計階段」,首要的目的是什麼? (A) 確認AI應用需求規格。 (B) 建立模型監控機制。 (C) 進行大規模應用擴散。 (D) 撰寫最終成果報告。 :::spoiler **答案** A ::: 5. 「設計階段」中「確認AI導入目標」時,設定的指標應具備什麼特性? (A) 越模糊越好,以便未來調整。 (B) 僅限於質化描述,不需量化。 (C) 可量化且與AI實際任務高度相關。 (D) 由外部顧問單獨決定。 :::spoiler **答案** C ::: 6. 在「設計階段」的「確認數據」步驟中,企業部門主管需要蒐集哪兩種類型的數據? (A) 結構化與非結構化數據。 (C) 僅限於文字數據。 (B) 僅限於影像數據。 (D) 僅限於感測器數據。 :::spoiler **答案** A ::: 7. 「驗證POC階段」的主要目的是什麼? (A) 設定企業的長期發展目標。 (B) 驗證AI效果。 (C) 制定AI技術的倫理規範。 (D) 尋找新的市場機會。 :::spoiler **答案** B ### **「驗證POC階段」的說明** 在企業導入人工智慧(AI)解決方案的過程中,「**驗證 POC 階段**」(Proof of Concept Verification Stage),或稱「概念驗證階段」,是至關重要的一環。 **POC(概念驗證)**的定義: 概念驗證是一個小型、有限範圍的專案,旨在驗證一個想法、理論或技術在實際應用中是否可行,以及是否能產生預期的效果或價值。它不是一個完整的產品或服務,而是一個用來測試特定假設的工作原型。 **「驗證POC階段」的主要目的與重要性:** 1. **驗證 AI 技術的可行性與效果**: * 這是核心目的。在這個階段,企業會運用有限的數據和資源,建立一個小型的 AI 模型或系統原型,以測試該 AI 解決方案在特定情境下是否真的能達到預期的功能和效果。例如,確認 AI 模型是否能正確識別圖像、準確預測趨勢或有效處理自然語言。 * 它旨在回答:「我們的 AI 解決方案在這個特定問題上是否可行?它的表現是否符合預期?」 2. **證明商業價值 (Proof of Value)**: * 除了技術可行性,POC 也常被用來證明 AI 解決方案所能帶來的潛在商業價值。例如,證明 AI 驅動的品質檢測能有效降低瑕疵率,或 AI 客服能顯著提升客戶滿意度。 * 這有助於獲得高層支持,決定是否投入更多資源進行全面開發。 3. **降低風險**: * 在全面投入大量資金和時間開發之前,透過 POC 可以及早發現技術上的挑戰、資料問題或潛在的瓶頸。這有助於在早期階段修正方向,避免後期投入巨大成本後才發現不可行。 4. **收集初步回饋**: * 即使是小規模的 POC,也能夠從潛在用戶或業務部門那裡獲得初步的使用回饋,這對於後續的設計和開發具有指導意義。 **此階段常見的工作內容:** * **資料準備**:收集並整理小規模但具代表性的數據集。 * **模型建構與訓練**:利用準備好的資料,建立並訓練初步的 AI 模型。 * **驗證與最佳化**:對模型進行測試和評估,根據結果對模型進行調整和優化。 * **部署(小規模原型)**:將驗證過的模型部署到一個受控的環境中,進行實際運作測試。 簡而言之,「驗證 POC 階段」是企業在 AI 導入路徑上的一個關鍵檢查點,用於以最小的成本和風險來驗證 AI 解決方案的潛力和有效性,為是否進入全面開發和實施階段提供決策依據。 --- ::: 8. 在「驗證POC階段」中,計算ROI(投資回報率)時,以下何者屬於「量化效益」的考量? (A) 提升員工和客戶滿意度。 (B) 有利將老師傅內隱知識留在企業。 (C) 減少工時。 (D) 員工抗拒變革。 :::spoiler **答案** C ### **「驗證POC階段」中 ROI 的「量化效益」考量** 在 AI 導入的「驗證 POC(概念驗證)階段」,計算投資回報率(ROI)是評估專案是否值得繼續投入的重要環節。ROI 的計算需要將投入的成本與所獲得的效益進行比較。其中,「量化效益」指的是那些可以直接用數字、金錢或明確的指標來衡量的效益。 **量化效益 (Quantifiable Benefits)** 量化效益是指那些可以直接轉化為財務數字或可衡量指標的利益。這些效益通常會直接影響企業的收入、成本或效率。在計算 ROI 時,這些是主要納入考量的部分。 **常見的量化效益範例:** * **減少工時/人力成本**:例如,AI 自動化了某項重複性任務,使得員工完成相同工作所需的時間減少,直接節省了勞動成本或釋放了人力用於更高價值的活動。 * **提高生產效率/產能**:AI 系統提升了產線的效率,在相同時間內生產更多產品。 * **降低營運成本**:減少能源消耗、減少設備維護成本、降低庫存成本等。 * **減少錯誤率/品質改善**:AI 輔助的檢測系統降低了產品缺陷率,從而減少了廢品損失、重工成本或客戶投訴。 * **增加收入/銷售額**:AI 推薦系統提高了客戶購買轉換率,或預測模型幫助企業抓住新的市場機會,增加銷量。 * **縮短產品上市時間**:AI 加速了設計或開發流程。 --- ### **選項分析** * **(A) 提升員工和客戶滿意度**:這屬於「**質性效益**」(Qualitative Benefits)。雖然滿意度很重要,且長期可能間接影響財務,但它本身通常不容易直接量化為具體的貨幣數字來計算 ROI。例如,客戶滿意度的提升可能帶來更高的留存率和口碑,這些最終可能轉化為收入,但滿意度本身是一個感受性的指標。 * **(B) 有利將老師傅內隱知識留在企業**:這也屬於「**質性效益**」或戰略性效益。它對企業的長期發展和知識管理有益,但無法直接用金額或具體數值來衡量其回報。 * **(C) 減少工時**:這是一個典型的「**量化效益**」。減少的工時可以直接換算為節省的人力成本(如果因此減少了薪資支出或使得員工能處理更多任務而無需增員),或帶來產能的提升。 * **(D) 員工抗拒變革**:這是一個潛在的**風險或挑戰**,而非效益。它可能導致專案推動困難,甚至增加額外成本。 因此,「減少工時」是這四個選項中,唯一能夠直接且明確地進行量化,並用於 ROI 計算的效益考量。 ::: 9. 以下何者不屬於企業導入AI「驗證POC階段」的工作項目? (A) 模型開發、訓練、優化、部署。 (B) 確認AI於作業中的主輔角色與回饋機制設計。 (C) 從Pilot成效推估導入方案投資成本與效益。 (D) 盤點企業能採用的AI解決方案選項。 :::spoiler **答案** D ::: 10. 企業導入AI的「實施/營運階段」的主要目標是什麼? (A) 選擇最佳的AI硬體設備。 (B) 持續發揮導入AI價值。 (C) 進行AI系統的壓力測試。 (D) 初步評估AI導入成本。 :::spoiler **答案** B ::: 11. 在「實施/營運階段」中,「方案落地」的目的是什麼? (A) 重新訓練AI模型。 (B) 監控模型準確率。 (C) 確保AI導入既有流程後,受影響的人員能適應變動。 (D) 擴散AI應用至各部門。 :::spoiler **答案** C ### **「方案落地」的說明** 在企業導入人工智慧(AI)解決方案的生命週期中,「**實施/營運階段**」(Implementation/Operation Phase)是將概念轉化為實際價值的關鍵時期。而「**方案落地**」(Go-Live / Solution Implementation / Operationalization)則是此階段的核心目標之一。 **「方案落地」的定義與目的:** 「方案落地」指的是將已開發、測試並驗證過的 AI 解決方案,從試驗或測試環境正式**整合並推行到企業的日常營運流程和實際工作中**。它不僅僅是技術上的部署,更包含了組織、人員、流程等全方位的準備與實施,以確保 AI 系統能夠順暢運作並被有效利用。 **「方案落地」的主要目的包括:** 1. **實現 AI 解決方案的全面運行**: * 確保 AI 系統與企業現有的 IT 基礎設施、資料庫和業務系統完成整合,實現自動化運作。這意味著 AI 不再是實驗室裡的工具,而是生產環境中真正發揮作用的一部分。 2. **確保受影響人員的適應與採用**: * 這是「方案落地」中極為關鍵的人力層面。新的 AI 系統往往會改變員工的工作方式、流程和職責。因此,提供充分的培訓、溝通和支持,幫助受影響的員工理解這些變革、掌握新工具的使用方法,並樂意接受和適應這些變動,是方案成功的基礎。如果員工抗拒或不願使用,再好的技術也無法發揮作用。 3. **開始獲取實際業務價值**: * 只有當 AI 方案真正落地並在日常營運中使用後,它才能開始產生預期的業務效益,例如提高效率、降低成本、優化決策或創造新的收入來源。 4. **建立持續優化的基礎**: * 方案落地後,透過實際運行的數據和用戶回饋,企業可以持續監控 AI 模型的性能、準確性,並進行迭代優化,確保其長期穩定且高效地提供價值。 --- ### **選項分析** * **(A) 重新訓練 AI 模型**:這是模型優化和維護的一部分,通常在模型運行中持續進行,或根據性能監控結果觸發,而非「方案落地」本身的目的。 * **(B) 監控模型準確率**:這是「實施/營運階段」的重要工作內容,屬於方案落地後的持續管理,但不是「落地」本身的終極目標。 * **(C) 確保 AI 導入既有流程後,受影響的人員能適應變動**:這精確描述了「方案落地」的核心目的之一,尤其是在將技術融入實際業務操作和人員日常工作中時,人與流程的適應性至關重要。 * **(D) 擴散 AI 應用至各部門**:這是「AI 價值擴散」階段的目標,通常在單一領域或部門成功落地並驗證價值後,才會考慮將其推廣到企業的其他部門或應用場景。這是一個更宏觀、更後續的策略。 因此,「方案落地」不僅是技術部署,更是一個確保 AI 解決方案能夠被組織和人員接受並有效利用的綜合性過程。 ::: 12. 企業在「實施/營運階段」為持續發揮AI價值,需執行哪些步驟? (A) 方案落地、模型監控與重新訓練、AI價值擴散。 (B) 掌握企業課題、檢視AI方案與企業資源、確定應用領域優先順序。 (C) 確認AI導入目標、確認數據、確認AI應用情境、初估AI導入成本。 (D) 模型開發至部署、確認實務運作模式、計算ROI。 :::spoiler **答案** A ::: 13. 在AI導入的「構想階段」,「確定應用領域優先順序」時,部門主管會從哪兩個面向進行評估「導入可能好處」? (A) 量化效益、質化效益。 (B) 技術可行性、市場需求。 (C) 數據量、數據品質。 (D) 人力成本、軟體成本。 :::spoiler **答案** A ### **「構想階段」中評估「導入可能好處」的面向** 在企業導入人工智慧(AI)解決方案的「**構想階段**」(Ideation Phase),核心工作之一是「確定應用領域優先順序」。在這個過程中,部門主管會評估將 AI 導入特定領域可能帶來的好處。這些好處通常從兩個主要面向進行評估: 1. **量化效益 (Quantifiable Benefits)** * **定義**:指那些可以被直接用數字、金錢或具體指標來衡量和計算的效益。這些效益通常會直接體現在財務報表或營運數據上。 * **範例**: * **成本降低**:透過自動化減少人力、減少材料損耗、降低能源消耗等。 * **效率提升**:縮短處理時間、提高生產速度、減少錯誤率。 * **收入增加**:提高銷售額、增加客戶轉化率、開發新的收入來源。 * **投資回報率 (ROI)** 的直接組成部分。 2. **質化效益 (Qualitative Benefits)** * **定義**:指那些難以直接用數字或金錢量化,但對企業具有重要策略意義或長期價值的效益。這些效益通常影響企業的品牌形象、員工士氣、決策品質或競爭力。 * **範例**: * **提升客戶滿意度**:雖然難以直接量化為金錢,但長期能提高客戶忠誠度、減少流失。 * **改善員工體驗與士氣**:自動化重複性工作,讓員工能專注於更有價值的工作。 * **優化決策品質**:AI 提供更精準的洞察,協助管理層做出更好的策略決策。 * **增強品牌聲譽與競爭力**:展現企業在技術創新方面的領導地位。 * **知識傳承與保留**:如將老師傅的內隱知識轉化為 AI 系統的顯性知識。 在評估 AI 導入時,管理者需要綜合考量這兩種效益,因為有時即使量化效益不明顯,質化效益也可能對企業的長期發展至關重要。 --- ### **其他選項解釋** * **(B) 技術可行性、市場需求**: * 這些是評估 AI 專案是否值得進行的**重要考量因素**,但它們本身不是「好處」的直接面向。 * **技術可行性**:評估是否有足夠的技術能力、數據和基礎設施來成功開發和部署 AI 方案。 * **市場需求**:評估市場上是否存在對該 AI 解決方案的實際需求,以及其產品化或服務化的潛力。 * 這兩者是評估**專案是否應該啟動**的面向,而非直接用來衡量其「效益」的類別。 * **(C) 數據量、數據品質**: * 這是 AI 專案在「構想階段」或「設計階段」評估**技術可行性**和**數據準備**的重要因素。AI 模型的訓練極度依賴大量且高品質的數據。 * 但它們是實現效益的**前提條件**或**挑戰**,而不是「導入可能好處」的直接分類面向。 * **(D) 人力成本、軟體成本**: * 這些是 AI 專案導入的**成本考量**,屬於「投資」的部分。它們與「好處」(效益)是相對應的概念。在計算 ROI 時,效益是分子,成本是分母。 ::: 14. 若企業在「設計階段」要確認AI導入的數據條件,以下何者是重要的考量項目? (A) 員工的AI技能水平。 (B) 專案管理人員的經驗。 (C) 數據量、品質與多樣性。 (D) 外部顧問的收費。 :::spoiler **答案** C ::: 15. 在計算AI導入的ROI時,「降低安全事故發生機會」屬於哪種效益? (A) 量化效益。 (B) 質化效益。 (C) 直接成本。 (D) 間接成本。 :::spoiler **答案** B ### **「降低安全事故發生機會」為何屬於質化效益?** 您提出的疑問「為什麼不是量化,降低不是數字上有變化嗎?」非常關鍵,它觸及了量化效益和質化效益之間的重要區別。 **效益的分類:** * **量化效益 (Quantifiable Benefits)**: * 指的是那些**可以直接用具體貨幣金額、時間單位或明確可數的數字來衡量,並能直接、穩定地納入 ROI 計算公式中的效益**。這些效益通常對公司的損益表有直接且可預測的影響。 * **例子**: * **減少工時**:直接節省人力成本。 * **提高生產效率**:每小時生產的產品數量增加,單位成本降低。 * **節省營運費用**:如能源消耗減少、維護費用降低。 * **增加銷售額/收入**:客戶轉化率提升、新客戶獲取。 * **質化效益 (Qualitative Benefits)**: * 指的是那些**難以直接用具體數字、貨幣或標準化指標來衡量,但對企業具有策略性、長期性或非財務性價值的效益**。它們的價值往往體現在品牌形象、員工士氣、風險管理、合規性或長期競爭力等方面。雖然這些質化效益最終也可能間接導致量化效益(例如,更高的客戶滿意度可能帶來更多銷售),但其本身的「感受」或「機率降低」很難被精確地貨幣化或標準化為 ROI 公式中的單一數字。 --- ### **解釋「降低安全事故發生機會」** 「降低安全事故發生機會」之所以屬於**質化效益**,原因如下: 1. **難以直接貨幣化**: * 您可以說「事故發生機會**降低了 X%**」,這是一個數字上的變化。但是,這個「機會降低」本身,**如何直接換算成具體的財務節省金額**,是非常困難且不確定的。 * 一個安全事故可能導致多種後果,包括人員受傷、設備損壞、停工損失、聲譽損害、法律訴訟和罰款等。這些後果的**潛在成本是巨大的,但不確定會不會發生,以及發生了會有多少損失**。你無法準確地說,降低 10% 的事故機會,就等於節省了 X 萬元的開支。 2. **不確定性與潛在性**: * 「降低機會」意味著**潛在風險的降低**。這是一種類似於「買保險」的概念。你支付保費(AI 導入成本),來降低未來可能發生的巨大且不確定的損失。 * 量化效益通常是**確定的、已經發生或高度預期的**利益。而降低事故發生機會的價值,則在於避免了**不確定性**的損失。 3. **核心價值在於風險管理和聲譽**: * 安全事故的發生不僅帶來直接損失,更會嚴重損害企業聲譽、影響員工士氣、導致合規問題,甚至引發法律責任。AI 降低事故發生的機會,主要價值體現在**風險管理、企業社會責任和品牌形象維護**上,這些都是典型的質化效益。 雖然「降低安全事故發生機會」的確切數字變化(例如,從每年 5 次事故降到 2 次)可以統計,但將這種「事故次數的減少」直接、明確地轉換為 ROI 計算所需的「貨幣收益」則極具挑戰性,因為**每次事故造成的損失都是獨特且難以預估的**。因此,它更多被視為一種提升安全性、降低潛在風險的質化效益。 --- ::: 16. 企業在評估是否導入AI應用時,「了解企業的目標和挑戰」屬於哪個評估面向? (A) 分析現有數據和技術基礎。 (B) 員工技能和培訓需求。 (C) 評估企業需求和現狀。 (D) 企業痛點識別及AI技術匹配。 :::spoiler **答案** C ::: 17. 在評估企業的「技術基礎」時,以下何者是重要的考量點? (A) 硬體資源與網路設施。 (B) 員工的溝通能力。 (C) 企業的市場佔有率。 (D) 競爭對手的AI應用。 :::spoiler **答案** A ::: 18. 企業若發現「運營效率低」這個痛點,可以匹配的AI技術解決方案不包括下列何者? (A) 自動化和流程優化技術。 (B) 預測維護。 (C) 資源優化。 (D) 市場趨勢預測。 :::spoiler **答案** D ::: 19. 為了確保模型能長期適應動態的業務環境並保持高效預測能力,在「實施/營運階段」應執行什麼工作? (A) 制定分階段交付計畫。 (B) 創建事件回應計畫。 (C) 監控模型準確率,適時重新訓練模型。 (D) 阻止不良內容生成。 :::spoiler **答案** C ::: 20. 在企業導入AI解決方案的「構想階段」,「檢視AI方案」的目的是什麼? (A) 確定AI系統的開發框架。 (B) 選擇AI模型的評估指標。 (C) 根據提取現場改善項目,尋找對應AI方案。 (D) 預估AI解決方案的總成本。 :::spoiler **答案** C ::: 21. 企業導入AI的「設計階段」中,關於「初估AI導入成本」的費用項目,不包括下列何者? (A) 人力費用。 (B) 軟硬體費用。 (C) 開發費用。 (D) 市場行銷費用。 :::spoiler **答案** D ::: 22. 在AI導入的「驗證POC階段」,「模型開發至部署」的主要工作內容應包含什麼? (A) 僅限於資料收集。 (B) 僅限於用戶培訓。 (C) 資料準備、模型建構訓練、驗證、最佳化、部署。 (D) 制定系統整合介面。 :::spoiler **答案** C ::: 23. 若企業在「實施/營運階段」要「AI價值擴散」,除了從技術層面解決問題外,還需考量哪些層面? (A) 僅限於成本控制。 (B) 僅限於市場佔有率。 (C) 文化、制度。 (D) 僅限於法律合規。 :::spoiler **答案** C ### **選項分析** * **(A) 僅限於成本控制。** * **錯誤原因:** 成本控制當然是企業營運的重要一環,AI 導入也需考量成本效益。但「AI 價值擴散」的目標是將 AI 的價值最大化並應用於多個領域,這遠遠超出了單純的成本控制。如果只考慮成本,可能會錯失許多創造價值的機會。 * **「僅限於」的影響:** 這個詞將考量範圍限制得過於狹隘,排除了其他同樣重要甚至更重要的面向。 * **(B) 僅限於市場佔有率。** * **錯誤原因:** 市場佔有率是企業在外部市場上的表現指標。雖然 AI 應用(例如行銷 AI、產品優化 AI)最終可能間接提升市場佔有率,但「AI 價值擴散」本身是一個企業內部的管理和實施過程,它涵蓋了提升內部效率、優化決策、改善員工體驗等多個維度,不單單只為了市場佔有率。 * **「僅限於」的影響:** 同樣,這個詞讓考量範圍過於局限,忽視了內部效益和其他策略目標。 * **(C) 文化、制度。** * **正確原因:** AI 的導入和擴散不只是一個技術問題,更是一個組織變革問題。 * **文化 (Culture):** 指的是企業的價值觀、員工的心態、對新技術的接受度、內部協作方式等。如果企業文化對 AI 持抗拒態度,或者缺乏擁抱變革的氛圍,AI 應用很難真正落地和擴散。 * **制度 (Systems/Institutions)**:指的是企業的組織架構、業務流程、績效評估體系、決策機制等。AI 的導入往往需要調整現有流程,甚至建立新的部門或職位。沒有相應制度的支持,AI 的價值也無法充分體現。 * 這兩者是確保 AI 能夠被員工接受、融入日常工作流程,並持續產生價值的關鍵非技術層面。 * **(D) 僅限於法律合規。** * **錯誤原因:** 法律合規(如資料隱私、倫理規範)對於 AI 專案至關重要,是 AI 導入的基礎和底線,必須確保符合法規要求。然而,合規是「必須做」的事情,而不是「擴散價值」的全部考量。價值擴散旨在創造更多效益,而合規是避免風險。 * **「僅限於」的影響:** 這個詞再次將考量範圍限制得過於狹隘,排除了其他積極創造價值的面向。 ### **總結** 在 AI 導入的「實施/營運階段」中要實現「AI 價值擴散」,除了技術本身,確實需要進行全面的規劃和考量。選項 (A)、(B)、(D) 雖然提及的內容可能與 AI 有關,但因為「僅限於」這個限制詞,使得它們無法涵蓋價值擴散所需的廣泛考量。而選項 (C) 的「文化、制度」則恰當地代表了企業在組織、人員和流程方面,除了技術之外,必須深入考量的非技術層面,這些因素對於 AI 成功融入並為企業創造廣泛價值至關重要。 ::: 24. 在企業導入AI時,若發現「產品品質不穩定」的痛點,最適合匹配的AI技術是? (A) 自然語言處理(NLP)。 (B) 情感分析。 (C) 機器視覺技術。 (D) 推薦系統。 :::spoiler **答案** C ::: 25. 企業在AI導入的「構想階段」進行「方案排序」時,會透過什麼方式進行評分,以判斷優先順序? (A) 僅依據最高階主管的直覺。 (B) 僅考慮技術複雜度。 (C) 藉由導入難易度/效益問項表。 (D) 排除所有風險。 :::spoiler **答案** C ::: 26. 企業若要利用AI解決「客戶服務不佳」的痛點,可以透過哪一項AI技術來改善? (A) 預測維護。 (B) 能源管理系統。 (C) 自然語言處理(NLP)。 (D) 品質預測。 :::spoiler **答案** C ::: 27. 在AI導入的「驗證POC階段」,確認實務運作模式時,需要釐清AI扮演什麼角色? (A) 僅為輔助角色. (B) 僅為主要決策者. (C) 主輔角色. (D) 僅負責數據收集. :::spoiler **答案** C ### **「主輔角色」的說明** 在 AI 導入的「驗證 POC(概念驗證)階段」,「確認實務運作模式」是一個核心任務。這涉及的不僅是技術是否可行,更重要的是 AI 將如何與現有的人員和流程協同工作,以及它在整個業務流程中將承擔什麼樣的責任和權力。此時,釐清 AI 所扮演的「**主輔角色**」至關重要。 **「主輔角色」的定義:** 「主輔角色」指的是在實際運作中,人工智慧系統可以根據具體的應用場景、風險程度和業務需求,靈活地扮演「**主導者(主要決策者或執行者)**」或「**輔助者(提供建議、自動化輔助性工作)**」的雙重角色,或者兩者兼具,形成人機協作的不同模式。 * **AI 扮演「主」角色(主要決策者/執行者)**: * 這意味著 AI 系統在特定、明確定義的流程中,自主地做出決策並執行操作,通常無需或僅需最低限度的人工介入。這類應用往往涉及高度自動化、重複性高、規則明確且決策風險相對較低的工作。 * **範例**: * **智慧客服機器人**:對於常見問題,AI 直接提供答案或解決方案,無需人工客服介入。 * **自動化品質檢測**:AI 視覺系統自主判斷產品是否合格,並觸發後續的分類或剔除動作。 * **機器人流程自動化 (RPA)**:AI 驅動的機器人自動執行資料輸入、報表生成等重複性辦公任務。 * **AI 扮演「輔」角色(輔助者/建議提供者)**: * 這意味著 AI 系統主要作為人類的工具或助手,提供分析、洞察、預測或推薦,輔助人類做出更明智的決策或更高效地完成工作。最終的決策權和執行責任仍保留在人類手中。這類應用常見於涉及複雜判斷、高風險、需要倫理考量或非結構化問題的場景。 * **範例**: * **醫療診斷輔助**:AI 透過分析病歷和影像,提供診斷建議,最終由醫生做出判斷。 * **金融風控預警**:AI 識別潛在的詐欺行為或風險客戶,提醒銀行人員進行人工審核。 * **商業決策支援**:AI 分析市場趨勢,提供銷售預測或行銷策略建議,由業務主管進行最終決策。 ### **為何在 POC 階段釐清主輔角色很重要?** 在 POC 階段確認 AI 的主輔角色,對於專案的成功至關重要,因為它: 1. **影響設計與開發**:釐清角色有助於設計出更符合實際操作需求的 AI 系統介面、功能和流程。 2. **明確責任歸屬**:尤其是在涉及決策的應用中,明確 AI 和人類的責任界限,有助於風險管理和合規性。 3. **促進人員接受度**:讓員工清楚 AI 將如何影響他們的工作,並透過培訓確保他們能與 AI 有效協作,減少對新技術的抗拒。 4. **指導評估指標**:不同的角色需要不同的評估指標。例如,主導型 AI 更看重準確率和效率,而輔助型 AI 可能更看重建議的實用性、可解釋性。 總之,「主輔角色」強調了 AI 在企業中應是人機協作的關係,而不是單純的取代。在 POC 階段明確這一點,有助於構建更務實、更有效且更具韌性的 AI 解決方案。 ::: 28. 在企業評估導入AI的「設計階段」,設定「應用產出(output)」時,需要考量哪些項目? (A) 僅限於數據來源。 (B) 分析項目、顆粒度、週期。 (C) 僅限於硬體配置。 (D) 僅限於培訓需求。 :::spoiler **答案** B ::: 29. 若企業計畫導入AI以提升「創新能力」,可以選擇哪一項AI技術來支援? (A) 生成式AI技術。 (B) 自動化流程機器人(RPA)。 (C) 傳統數據庫管理。 (D) 機器視覺品質檢測。 :::spoiler **答案** A ::: 30. 在AI導入的「實施/營運階段」,為確保解決方案的有效性、安全性和用戶滿意度,並遵守相關法律和隱私政策,發佈和運營解決方案的關鍵步驟不包括? (A) 設計分階段交付計畫。 (B) 創建事件回應計畫。 (C) 防止濫用。 (D) 完全放棄人工審核。 :::spoiler **答案** D :::