Try   HackMD

SITCON 2020 共筆大集合

歡迎大家來到SITCON 2020 ヽ(✿゚▽゚)ノ

slido: https://app.sli.do/event/ozdireqh/live/questions

機器學習 ~= 找一個函式的能力(根據資料)

依照函式種類,會有不同做法:

EX: 迴歸、分類( alphago 其實也是一種分類問題)

除了上述以外,還有 generation(生成),可以生成句子、圖片等,可以擬人化的創出各項成果。

EX: Google Big GAN

怎麼告訴機器要找的函式?

貓照片輸入 -> 函式訓練 -> 對應貼標的貓(labelled data)-> 找出 loss 最低。

學習型演算法(learning Algorithm)
EX: Gradient Descent

函式庫:tensorflow, keras,

所有問題都被解決了嗎?

機器容易被欺騙

  • 貓圖片進去,回答出 Tiger Cat(正確)
  • 可是:如果加入雜訊(人眼可能無法察覺) -> 會回答出Star Fish(錯誤,而且演算法的判斷信心會過高)
  • EX: 圖片會因為雜訊多寡,而導致判斷成不同品種或標籤。

新的資安問題

影像、語音、文字辨識的相關應用可能不安全

影像辨識

戴上有特殊花色的眼鏡,就會被影像辨識系統認成另一個人。

語音辨識

偵測一段語音是否合成。

EX:銀行語音系統的語者辨識系統被合成聲音騙過。

文字相關應用

在訓練文章末尾插入 .. to kill America people ,結果 AI 得出答案都變成
.. to kill America people

正確答案 ≠ 智慧

Case study : Pokémon(寶可夢) vs Digimon(數碼寶貝)

  • 訓練神經網路判斷
  • 未知圖片正確率 Testing accuracy :98.4%

可解釋性 AI (Interpretable AI)

  • 機器告訴我們他為什麼知道答案

機器預期的位置跟人的經驗不一樣

  • PNG 有透明背景
  • JPG 背景有顏色
  • 左下角可能有段字,說明從哪裡下載下來的圖片。

看似未卜先知,其實可能只是抓到人類出題的漏洞!

  • Question: What did Telsa spend Astor's money on?
    reduced: did? (得到相同答案)

  • Question: What color is the flower?
    reduced: flower?(得到相同答案:yellow)

機器學習學不會新技能!

透過不斷教機器新技能,讓機器得到許多技能,But

  • 題型五的正確率,在前四題學習時並不會,所以得不到答案
  • 學習題型五時後,會得到正確解答
  • 可是學習題型六之後,可能就會忘記題型五的解答案得不到正確解答

Catastrophic Forgetting

  • 瞬間忘光光(腦袋有洞的人,學新的就丟舊的)

是不是機器能力不夠啊?

不同題型的閱讀理解

  1. 依序學學不會
  2. 一起學就 OK

不是能力不夠

Life-long Learning

  • 希望機器能夠像人類一樣: 終身學習

更有效率的學習

今天的學習:

  • 輸入:有標注資料
  • 輸出:最佳函式
  • 訓練(找函式)用演算法:缺乏效率
    • 機器完星海爭霸:換成人要訓練 200 年

學習如何學習 = Meta learning

Machine learning : 根據資料找一函數 f 的能力

Meta learning: 根據資料找一個 找一函數 f 的 函數 F 的能力

機器學習
找一個函數的能力(根據資料)

Supervisored learning 督導式學習:需要提供輸入與輸出資料的關係
Unsupervisored learning 非督導式學習:不需要提供輸入與輸出資料的關係

Voice conversion :

  • Past
    • 阿笠博士的領結變聲器
    • 過去需要有 labelled data
  • Now
    • 字詞不一樣也能合成聲音
    • 不需要手動提供含是的輸入輸出對應

Unsupervised Voice conversion :

  • Only one utterance from each speaker (one-shot learning)
  • 講者 <—> 新垣結衣

機器學習待解問題(工商)

QA

電機系

顯卡

  • 業界: 1000 張

大量耗電

  • 大量用顯卡,需要大量運算,但不一定是人工智慧的最終答案,未來或許會有別的方法

量子機器學習

  • 如果量子電腦能提供更多運算資源會有機會

非資訊背景學 Machine Learning 如何下手比較好

取決於學的程度

  • 只是要避免被報章雜誌誤導:基礎就好

前瞻研究

  • solid 數學基礎
  • 要會寫程式

高中生學 Machine Learning ,選擇電機還是資工

  • 不一定要限定自己在哪個系學 Machine Learning
  • 學習面向是多元的

數學基礎培養建議

  • 工科或電子:必修學好