# CH01 AI起源 ## 1-2 人工智慧的發展 ### 誕生期 1943:提出具備可處理二元狀況的神經元(Warren & Walter) 1950:提出圖靈測試(Alan) 1956:達特茅斯會議正式定義人工智慧為一門新學科 ### 成長期 1957:提出感知器學習規則(frank) 1958:提出LISP人工智慧程式語言(John) 1958:提出結合知識表達和推理的Advise Taker電腦程式(John) 1959:開發出解決一般性問題的解題程式,並成功解出盒內塔問題(Allen等人) 1960:提出自適應線性神經元,透過成本函數台推導學習規則(Widrow & Hoff) 1965:提出模糊集合理論(L.A.Zadseh) 1966:美國計畫經費補助的人工智慧相關計畫紛紛被取消 1968:DENTRAL專家系統誕生,用LISP語言撰寫(世界上第一個專家系統) 1969:倒傳遞學習概念被提出(但未受到重視) 1971:英國政府暫停補助人工智慧相關研究 ### 第一次寒冬 * 機器計算能力有限 * NP問題(Non-deterministic Polynomial Problem) * 停止挹注研究經費 ### 重生期 1972:開始發展MYCIN系統,使用規則推論引擎,並以LISP程式撰寫(Feigenbaum) 1975:提出框架形式表達的概念(Marvin) 1979:EMYCIN系統誕生,依據MYCIN系統,但使用空白的知識庫,使系統更具彈性 1982:神經網路和自我組織映射圖網路誕生(Hopfield) 1986:再度提出倒傳遞網路學習受到重視->多層感知機,又稱深度神經網路 1988:多層前饋式神經網路,神網路模型被提出 ### 第二次寒冬 * 專家系統的限制 * 倒傳遞演算法不是和多層網路學習 * 電腦硬體速度不夠快 * 訓練資料嚴重不足 ### 進化期 1977:IBM超級深藍打敗世界棋王 2007:ImageNet影像資料庫開始建立 2011:IBM超級電腦華生誕生,能夠理解人類語言,具備分析能力 2012:蘋果公司的iPhone 4s智慧型手機搭載Siri語音助理 2012:AlexNet採用深度學習架構,於ILSVRC競賽脫穎而出,15.3%的錯誤率,雖然不及人類,但相較於前一年的SVM模型,已經大幅提高圖像辨識的正確率(10%以上) 2016:AlphaGo以4:1戰勝南韓圍棋棋士 2017:AlphaGo Master以3:0打敗世界圍棋棋王 2017:AlphaGo Zero誕生,能力遠超過AlphaGo和AlphaGo Master ![image](https://hackmd.io/_uploads/HklhjYPgC.png) ### 三波AI浪潮 ![image](https://hackmd.io/_uploads/SyLaiFDeA.png) ## 1-3 人工智慧@臺灣 * 1980:李琳山教授漢語語音辨識、合成系統 * 1981:許舜欽《人造智慧在電腦象棋上的應用》學位論文,為臺灣發展電腦象棋對局之濫觴其團隊多次贏得世界象棋程式冠軍 * 顏士淨、吳毅成、徐讚昇等學者研發成果,在全球棋類競賽獲得佳績 * 許峰雄博士參與IBM深藍計畫 * 中正大學吳昇教授團隊研發蓋世(GAIS)搜尋引擎 * 黃士傑博士參與AlphaGo及AlphaZero圍棋程式研發計畫 * 2017:李開復博士撰寫《人工智慧來了》書籍 * 2017:中央研究院主導成立「人工智慧學校」 * 2017:政府宣示為「臺灣AI元年」 * 2018:教育部推動「人工智慧技術及應用人才培育計畫」,將人工智慧納入12年國教新課綱中的「資訊科技」課程 * 2018:經濟部於推動「AI智慧應用新世代人才培育計畫」 * 科技部以「小國大戰略」的思維推動人工智慧,訂定五項推展策略研發服務、創新加值、創意實踐、產業領航及社會參與 * 2019:鴻海教育基金會發行《人工智慧導論》書籍 # CH02應用篇 ## 2-1影像處理 * 影像是指對圖像進行分析、加工和處理,使其滿足視覺、心理或其他要求的技術 * 應用:治安、交通、醫療、國防、娛樂等多元場域 ### 2-1-1影像處理的功能 * 輸入: * 二維:灰階、黑白影像 * 三維:彩色(RGB) * 多維:影片、多張影像、多個影片 * 功能,主要分成四類: * 分類(Classification) 透過機器學習,判斷結果是屬於哪一種類別的方法。如圖2-1所示當輸入貓或狗的照片時,電腦會對輸入趙便進行判斷,接著輸出機率來分析輸入圖片是貓還是狗的照片。 * 目標物定位(Localization) 目標物定位是找出感興趣的對象其邊界的過程。目標定位與目標偵測非常相似,唯一的差別是目標定位僅關注一個主要對象,而目標訂稅的本質上是負責處理邊界框 * 偵測(Detection) 目標物偵測是對多個目標進行定位與椎衝,用於檢測數字圖像和影片中特定的對象。 * 分割(Segmentation): * 語意分割(Semantic) 也可以當作是圖像分類,目的是將圖像中的每個像素連接到類別標籤的過程。這些標敲可以是動物、植物、天空、草地,也可以是車輛、馬路、人類。 * 實例分割(Instance) 實例分割可以檢測輸入圖像中的對象。將他們與背景隔離,並根據其類別對他們進行分組,並且檢測相似對象群集中的每個單獨對象,並為每個對象繪製邊界 ![image](https://hackmd.io/_uploads/r1KmWqPgC.png) ### 2-1-2車牌辨識 * 停車場應用:量販店家樂福,在車輛停入停車格的時候進行拍照,並將此停車格設置成有車輛正在使用,以便即時掌握空車位的資訊,並導引其他車輛進入尚未被佔用的空停車位。 * 業者也可以透過車牌辨識系統,對車子拍照並即時比對記錄的車牌資料,找到進入的車牌資料後,再確認消費者是否有完成繳費。 * 應用: * 停車場管理 * 大樓、校園車輛進出 * 贓車查緝 ![image](https://hackmd.io/_uploads/Sy7KzowxA.png) ![image](https://hackmd.io/_uploads/Hy1cMjwx0.png) ### 2-1-3人臉辨識 * 每個人臉的特徵(臉型、膚色、眼睛、鼻子、嘴巴、耳朵、眉毛等)都不同,因此,人類的辨識系統可以透過這些不同的臉部的特徵來辨識每個人的身份。 * 利用CNN來對分類人臉進行訓練,在訓練的過程中,CNN神經網路會抓取人臉五官的特徵,藉由這些五官的各種角度進行表情的特徵比對。 * 應用: * 海關出入境 * 大樓門禁 * 上班打卡 * 陌生人徘徊 ![image](https://hackmd.io/_uploads/SJoymoDg0.png) ![image](https://hackmd.io/_uploads/rkZfXjPlR.png) ### 2-1-4情緒辨識 * 透過攝影機拍攝人類臉部的表情特徵的照片,再將其透過人為標記,記錄該照片是開心、憤怒或沮喪,再將這些照片透過CNN進行圖像分析,提取每種情緒特徵,進而建構出一套情緒辨識系統。 * 應用實例: * 疲勞駕駛監測 * 測謊 ![image](https://hackmd.io/_uploads/BJ9BXswlA.png) ## 2-2自然語言處理 * 自然語言處理(NaturalLanguageProcessing,NLP)有**認知、理解、生成**等面向 * **認知**和**理解**是讓電腦把輸入的語言,變成有意思的符號和關係,然後根據目的進行處理 * **生成**則是把電腦資料轉化為自然語言 * 簡言之,讓電腦能和人類一樣,具有聽說讀寫的處理能力,並以此理解人類語言,稱為自然語言處理 * 應用: * 詞類標示 * 偵測詐騙郵件 * 摘要文本大綱 * 機器翻譯、語音辨識 ### 2-2-1機器翻譯 * 機器翻譯是指運用機器,透過特定的電腦程式,將一種文字或聲音形式的自然語言,翻譯成另一種文字或聲音形式的自然語言。 * 透過**計算語言學**、**人工智慧**和**數理邏輯**來教會機器**理解人類的語言**,機器翻譯是先把複雜的語言進行編碼,並轉換成電腦理解可計算的公式、模型和數字,再解碼成另一種語言。 * 應用: * 點餐 * 購票 * 與手機、家電結合 ![image](https://hackmd.io/_uploads/ByjFNoDgA.png) ![image](https://hackmd.io/_uploads/r1tc4svxA.png) ### 2-2-2聊天機器人 * 聊天機器人是指透過**人工智慧**、**電腦程式**模擬與使用者**互動**的對話,利用計算機自動回答使用者所提出的問題,以滿足使用者需求的任務 * 機器需正確**理解**(Understanding)使用者所提出的問題後回答,這過程涉及了包括**詞語、句法、語義分析**的基礎技術,以及**信息檢索、知識工程、文本生成**等多項技術 * 現今聊天機器人分成許多類型,最常見的是 * 回答問題 * 聊天 * 下訂單 * 檢索 ![image](https://hackmd.io/_uploads/ryiwLsPxC.png) ![image](https://hackmd.io/_uploads/BJrdUjwl0.png) ![image](https://hackmd.io/_uploads/H1uhLivg0.png) ### 2-2-3關鍵字與輸入法選字 * 透過**關鍵字**能了解不同**身分**與當前社會關注的**熱門議題** * 大學生:常出現的關鍵字可能為出國、留學、就業等 * 懷孕婦女:關鍵字可能為胎教、寶寶、孕期保健等 * 以個人利益來說,利用關鍵字能**提高搜索效率**,在最短時間找到你所需要的相關訊息。 * 商家則可透過**關鍵字廣告**,發掘巨大的商業價值,這個價值可能體現在短期的銷售增長上,更可能是長期企業品牌形象的提升上。 ![image](https://hackmd.io/_uploads/HyCQPjvgR.png) ### 2-2-4檢測垃圾電子郵件 * **垃圾郵件**指未經請求而發送的電子郵件,例如未經發件人請求或允許而發送的各種宣傳廣告或具有破壞性附有病毒的電子郵件。 * 常見內容包括賺錢訊息、成人廣告、商業或個人網站廣告、電子雜誌和連環信等 ![image](https://hackmd.io/_uploads/HJAg_owgR.png) ### 2-2-5文本情感分析 * 文本**情感分析**,也稱為**意見挖掘**,是指用**自然語言處理**、**文本挖掘**以及**計算語言學**等方法,來對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。 * 情感分析的**商業價值**,除了可以提早了解顧客對於產品或公司的觀感,進而調整營運策略方向。 * 情感分析也被應用在**聊天機器人**的領域上 ![image](https://hackmd.io/_uploads/rkwuuiPgA.png) ### 2-2-6個人助理-Siri * Siri最早內建在iPhone 4,此軟體使用到**自然語言處理**技術 * 使用者可以使用自然的對話與手機進行互動,完成**搜尋資料、查詢天氣、設定手機日曆、設定鬧鈴、及對話聊天**等服務。 * 在當時Siri顛覆了語音辨識的認知 * 以往語音辨識為**單向互動**(Voice to Search) * Siri的語音助理將語音辨識變成**雙向互動**(Voice to result),使用者與具有人工智慧的Siri和使用者進行對話的過程中,不是只有單純的輸入資訊,還可以和使用者進行「類人類的溝通」,同時從對話的過程中得到更直接的資料搜尋結果 ![image](https://hackmd.io/_uploads/SJyXKoDeA.png) ## 2-3邏輯推理 * 電腦在人工智慧上的表現,雖然在某些地方較人們優秀,但人們總認為是因為電腦的**計算速度快**及**記憶體大**這兩種優勢,人們一直覺得,電腦並不真的比人腦聰明,也不真的如同人們能思考、具有邏輯、甚至有感覺。 * 在**IBM深藍**與人們對決勝利後,雖然人們感到意外,但仍覺得那是靠快速的計算與龐大的記憶體來取勝,直到**AlphaGo**拿到世界圍棋的冠軍,才開始感受到人工智慧對人們智力及思考力的威脅 ### 2-3-1下棋 * **下棋**通常仰賴具有推理與邏輯能力,對電腦而言,計算、記憶及邏輯判斷,是完全不同的能力 * **西洋棋**:**深藍電腦**在下西洋棋時,主要先用**minimax**算法和**alpha-beta修剪法**來分析局面,然後再用評估函數來決定下一步的走法,使其勝率較大 * **圍棋**:圍棋是**搶地盤**,沒有一個明確的目標(如西洋棋的擒王)可以評估,再加上圍棋的棋只有一種,所以無法評估每一個棋的價值,更是增加了電腦分析的難度 ![image](https://hackmd.io/_uploads/BJLGqiPg0.png) ![image](https://hackmd.io/_uploads/H1QV9jPeC.png) ![image](https://hackmd.io/_uploads/BysVqsDxA.png) * AlphaGo: * 策略網路:輸入棋譜,運用增強式學習訓練 * 評估網路:評估局勢,計算勝率 * 蒙地卡羅搜尋樹:猜測對手可能會下的位置,接著逐步模擬期局進行,直到盤面結束,再選擇下棋的位置 * AlphaGoZero: * 只給圍棋基本規則,沒有棋譜 * 自我對弈,從中自我學習 * 三天後,超越AlphaGo ### 2-3-2寫詩(微軟小冰) * 寫詩、畫畫、寫文章,這些能力,並不像圍棋有所謂的勝負,也不像數學有數字可以用公式推導,而不論是詩、畫畫或文章之作品,其品質優劣是非常主觀的。 * 改良後的「**微軟小冰**」不但可以**聊天、主持節目、創作歌曲**等,諸多功能,甚至還可以做到**即興寫詩**的地步,你只要給他一張圖片,她就可以幫你寫出一篇詩 ### 2-3-3新聞稿 * 人工智慧在文學上的表現,不只可以應用於聊天或是寫詩而已,這項技術已經可以應用在產業界了,尤其是新聞界,人工智慧的技術,已經可以自動幫人們寫新聞稿了 * 這項技術已經有幾家新聞公司已經開始使用,–例如:美國知名報社<華盛頓郵報>在2016年使用寫稿機器人Heliograf來分析整理里約奧運的數據,並將訊息放到制式的新聞模板裡,然後做成新聞稿;–瑞士媒體巨擘Tamedia在瑞士選舉時,利用Tobi機器人在僅僅五分鐘的時間內就生產了大約四萬篇有關選舉的新聞 ## 2-4推薦系統 * 推薦系統在現今的生活中隨處可見,舉例來說,我們每天上FB看粉絲團、在YouTube上看影片、去電影網站上評分電影,在看完後被推薦下一個新聞、商品或影片繼續觀看,這其實就是在預測用戶可能會喜歡的東西。 * **新用戶**:推薦目前流行的商品 * **舊用戶**:根據過往紀錄,推薦適合商品 * 常見推薦技術: * Content-Based * Population Averages * Collaborative Filtering ![image](https://hackmd.io/_uploads/BJm2m2vgA.png) ### 2-4-1 基於內容的推薦(Content-Based) * 最早被使用的推薦方法為**基於內容**的推薦,它稱為Content-Based的方法。 * 基於內容的推薦,乃是根據用戶過去喜歡的商品(item),並從中分析這些被喜歡的**商品特徵**再去找沒買過的商品中與之**最相似**的特徵商品。 * 這種方法稱為**基於商品的推薦**或是**基於內容的推薦** ![image](https://hackmd.io/_uploads/BkeBN3veC.png) ### 2-4-2 基於熱門度的推薦(PopulationAverages) * 對一個新的使用者而言,推薦系統並無該使用者的購物或是瀏覽紀錄,所以我們並沒有辦法對於空白資料的使用者進行合適的推薦,也就是我們無法用上面提到的「基於內容的推薦」。 * 這時,推薦系統便可使用基於熱門度的推薦(Population Averages)這種方法來將商品推薦給新用戶 ![image](https://hackmd.io/_uploads/Byh5VnPxA.png) ### 2-4-3 協同過濾(CollaborativeFiltering,CF) * 在同樣都擁有用戶的歷史購物紀錄的條件下,我們除了採用**基於內容的推薦**的方法外,也可以採用**協同過濾**的方法對用戶進行推薦。 * 對於每位使用者而言,應該都會有許多與他購物習慣相似的使用者,而協同過濾就是找出與該使用者購物習慣相似的群體,並分析其偏好來預測該使用者的個人偏好,進而達到個人化(過濾其他不適合)的推薦效果。 * 其中**常見的方法**有 * 基於用戶(User-base)的協同過濾 * 基於物品(Item-base)的協同過濾 * 混和式(Hybrid)推薦 ![image](https://hackmd.io/_uploads/BJyMH3DeA.png) ![image](https://hackmd.io/_uploads/ByDGShvlR.png) ### 2-4-4 混和式推薦(Hybrid) * **混和式推薦**則是將上面所講推薦方法或是其他種類的推薦演算法進行混和利用 * 結合Content-based (CB)和User-based (UB) CF來進行混和式推薦UBUB ![image](https://hackmd.io/_uploads/SJkOSnPlR.png) ## 2-5 疾病預測與醫療 * 隨著醫療的進步,人們對疾病的處理態度不再只限於對症下藥,預防勝於治療的觀念也逐漸普及於大眾的認知。 * 隨著人工智慧的發展,對大量的醫療數據進行分析,以便對重大疾病能進行預測,已是人工智慧應用於醫療領域的發展趨勢。 * 雖然許多醫療AI應用,目前仍然只在影像判讀上有較多的著墨,但在這人工智慧和大數據正風起雲湧的時代,在不久之後,會大幅地改變全球的醫療體系與大環境。或許不至於取代人類在醫療領域中的地位,但必定會成為醫療領域中強力的助手 ![image](https://hackmd.io/_uploads/Bk1ArhPgA.png) ![image](https://hackmd.io/_uploads/HkW1LnPxC.png)