--- title: 人工智慧在台灣-ORID (original) tags: intumit --- [toc] :::info 以 info 來紀錄實際資料,並製作資料簡報。 ::: # [I] 從人工智慧談起 ## 人工智慧究竟是什麼? 本書人工智慧的定義: 1. 任何讓電腦能夠表現出「類似人類智慧行為」的科技 2. 是一種可以感知、學習、推理、協助決策,並採取行動幫助我們解決問題的科技 ### 人工智慧走過兩次寒冬 #### 第一波 把人類的知識與思考方式放入電腦 第一波約在 1950~1960 年代,希望讓電腦學會人類思考的「過程」,失敗的原因在於,連人類都還沒辦法清楚理解自己的思考過程,根本不可能將人類的語言脈絡、思考方式,乃至於理解、決策的具體步驟寫入電腦程式中。 #### 第二波 讓電腦按照人類定義的規則做決策 第二波約在 1980~1990 年代,以專家系統為首,讓電腦按照人類定義的規則做決策,希望讓電腦學會人類思考的「結果」,以「知識庫, knowledge base」與「推理系統, inference system」的方法來實現。 失敗的原因有二: 1. 主流商用ERP自 1990 年代後就有支援專家系統 2. 距離人們對人工智慧的期待還有很大的差距。差距很大的原因可以分三個層次來看: 1. 人類自己就無法解答的問題,專家系統當然也無法解答 2. 人類有能力解答,但規則不明確 3. 規則明確,但仍無法用程式碼表達 #### 我們懂的事,比自己能表達的多 這適合解釋上述的第二個層次,因為我們做的決策,很多是基於直覺或是內在經驗,無法用言語表達,更無法用程式碼書寫。當中可能有很多難以具體描述的內隱知識或經驗。 ### 第三波人工智慧 2006年,Geoffrey Hinton提出限制玻爾茲曼機模型(Restricted Boltzmann Machine),成功訓練多層神經網路(multi-layer neural networks),可用來描述更複雜的非線性函數,並稱之為深度學習(Deep Learning)。 :::info **深度學習參加 ILSVRC 一戰成名** 2012年,深度學習以 16.42% 的錯誤率大勝對手的 26.22% 錯誤率 2015年,以 3.5% 的錯誤率達到新的里程碑 人類的平均錯誤率是 5% ,也代表了正式具有實用價值。 ::: #### 三波人工智慧不同的代表技術 第一波代表技術:符號邏輯 - 符號邏輯需要的是領域專家,以 Lisp 或 Prolog 這樣的邏輯語言,用宣告式程式設計寫下決策邏輯。 第二波代表技術:專家系統 - 專家系統需要領域專家寫下經驗規則,通常用指令式程式設計來撰寫。 第三波代表技術:機器學習 - 領域專家必須提供歷史資料,讓電腦從這些資料歸納出專家的規則。 #### 機器學習vs.專家系統 機器學習與前兩波人工智慧最大的差異是,是基於「資料」而非人類的思考。 專家系統是由人來訂定規則,告訴電腦判別的方法;機器學習放棄由人類訂定規則,而是以資料來訂定規則。 #### 機器學習簡單說 本書機器學習的定義:任何可從資料歸納規則的演算法。 只要這個演算法,可以**接受我們輸入的歷史資料為輸入,根據歷史資料歸納並輸出決策規則,即一般常說的模型。我們可以將這個模型,套用在未曾見過的資料上,基於新資料以模型裡的規則做決策,並且決策的原則與歷史資料的原則相符**,就可歸類為機器學習。 機器學習的定義很廣,從迴歸(regression)、決策樹(decision tree)、支持向量機(support vector machine)到類神經網路(neural networks),都屬於機器學習的範疇。 ## 機器學習一次看懂 ### 機器學習與統計:方法相似,目的不同 統計是根據資料樣本,將其抽象化後得出上層意識;機器學習則是根據資料歸納規則並解決問題。 | 項目 | 統計 | 機器學習 | | -------- | -------- | -------- | | 學科 | 科學 | 工程 | |目的|見微知著|以已知預測未知| |輸入|小樣本|樣本(能小就小,但不是重點)| |輸出|全域資料的結構|能預測未知的模型| |技術|解析解為主|數值解為主| ### 機器學習與深度學習 機器學習有很多種演算法,類神經網路是其中一種,而深度學習又指多層(>三層)類神經網路。 #### 可自動進行特徵工程,才算深度學習 在發展機器學習模型時,基於「觀測值」來發想及定義「衍生變數」的過程稱為特徵工程,可以將這些衍生變數加入決策條件的判斷式中,來增進預測準確度,深度學習與其他所有機器學習方法的差異就是能夠「自動」進行特徵工程。 #### 特徵工程的難度 深度學習帶來的最大貢獻是,自動化的特徵工程,且找出比人類定義更好的特徵(衍生變數)。 #### 特徵工程越不好做,越適合深度學習 難做的特徵工程包含: * 非結構化資料: - 文字 - 影像 - 聲音 * 序列資料: - 零售交易資料 - 金融市場資料 - 各種感測資料(溫度、濕度、亮度) ### 比較專家系統、傳統機器學習與深度學習 #### 資料與運算可與專家互補 人工智慧目前的演進方向是越少的知識描述,越多的資料和運算,讓決策越來越精準。 傳統機器學習的領域專家非常重要,要提供標注資料及特徵工程,機器學習工程師也很重要,撰寫程式並根據訓練資料來訓練模型,並使用測試資料來驗證測試準確度。深度學習則弱化領域專家的角色。 #### 人工智慧工程師需求增加 深度學習的能力要拿資料、運算資源、人才來換,所以在結構性資料的問題,原則上會優先使用傳統機器學習來做成本會比較低。 #### 資料越多,深度學習表現越可靠 ### 機器學習的問題界定方式 1. 監督式學習(supervised learning) 在訓練過程中直接告訴機器答案,也就是將資料進行「標註」,著重於尋找觀測值和決策的關聯性,以數學來說就是尋找函數。 2. 非監督式學習(unsupervised learning) 若資料沒有標註,讓機器自行摸索出資料規則,稱為非監督式學習。常用在資料分析的前處理,讓之後的監督式機器學習效果更好。 3. 增強式學習(reinforcement learning) 增強式學習的特徵就是需要大量試驗,在技術門檻也比監督式學習與非監督式學習高出很多,進一步撇除人類的指導角色,自行找出規則作出更好的動作決策。 ## 人工智慧的誤解與迷思 # [II] 人工智慧與產業發展 ## 人工智慧發展的三個面向 ## 產業人工智慧化經驗談 ## 產業人工智慧化的挑戰與建議 # [III] 迎向未來的準備 ## 台灣人工智慧學校 ## 給政府的建言 ## 給白領工作者的建議