owned this note changed 7 years ago
Linked with GitHub

人工智慧下的資安新視野

tags: 2018, R1
位置: R1
講者:邱銘彰



我發下宏願,願意贊助全台灣conf冰淇淋
先Google我的名字,再問我是誰
邱銘彰

人工智慧來了

  • 機器視覺在2012年開始有突破(AlexNet)
  • 在影音辨識領域有大進展
  • 其它領域遇到的困難是資料集

ILSVRC:image Net

source link (圖片左右相反嘿~但內容一樣)

影像識別率

  • 在貓狗方面的識別失敗率,人類大概是5%,專家3%
  • 在影像識別方面取得巨大成功,不代表其他領域也同樣能夠成功

AlphaGo

  • 2017/01/04 公測結束為止 60戰全勝
  • 預測人類下棋準確度達57%
  • 所有下棋方法均模仿人類過往棋譜
  • 與李世石戰績 4:1

AlphaGo Zero

AlphaGo Zero

  • 3天超過贏過李世石的版本
  • 21天超過60戰全勝的版本
  • 40天勝過人類3000年
  • 強化學習讓AlphaGo Zero在圍棋比賽中==拋除雜念==,變得更加純淨
  • 真正高價值的棋譜資料難以收集,容易收集到的都是笨蛋下棋的棋譜
  • 讓兩個SL policy network機器人對下棋,把採樣資料從16萬盤棋擴增並留下好的三千萬盤棋
  • 已看過的下法使用policy network預測
  • 沒看過的下法使用Value network預測

最讓人驚訝的是,最終訓練出來的data intelligence超越了輸入的model intelligence

  • 被加入下棋BOT之前,機器人只有業餘初階棋士的程度

UCB (Upper Confidence Bound)

  • 探索新標的物與方法的機制
  • 為了避免永選取同樣的單一解,加入了Bonus機制
  • 加入UCB以後,BOT有機率走非最佳解的那一條路
  • ex. 小時候要探索博覽、長大以後再選定專精領域

跟笨蛋下棋是不會變聰明的 邱銘彰

讓電腦從經驗中學習 Reinforement Learning

  • 環境狀況條件改變時不用重寫程式
  • 奔跑程式遇上草地時不用重寫model
    Image Not Showing Possible Reasons
    • The image file may be corrupted
    • The server hosting the image is unavailable
    • The image path is incorrect
    • The image format is not supported
    Learn More →

Adversarial Examples

Machine learning特徵

  • 身處劣勢時無法逆轉局勢

知道紅燈停綠燈行,但看到三寶阿罵不知道該不該撞 邱銘彰

  • 沒有辦法表達 uncertainty : 加個貼紙香蕉就辨識成吐司、加個貼紙貓就辨識成鱷梨醬了

以後在車牌上貼個貼紙,辨識系統就會瘋掉不知道你是誰,這是個隱形的防護罩 邱銘彰

  • Machine learning 很怕攻擊性樣本
    人類對雜訊可以判斷並避開,但機器很受雜訊干擾判斷
  • 人類在採樣資料時存在偏見,導致機器對事實認真有偏差

結論 : 其實沒這麼美好,現實是殘酷的

  • 輸入空間的維度非常高,而動作空間的維度非常低,因此標籤的數量與輸入信息量相比非常小,很容易學到虛假關係
  • 使用股票代號去計算盈虧,收益居然比原本人工精打細算還高
  • 沒有free Lunch,你永遠需要了解Domain,需要輸入prior knowledge
  • NN的表達不確定性的能力極差
  • NN是難以解釋的黑箱、缺乏透明度,難以令人信任,使的深度學習難以佈署到一些重要的任務上
  • Reinforement Learning雖然可以從經驗中學習,聽起來很屌,但是真實世界的reward是sparse的,且reward的訊息量很少
  • 但是比上面更重要的是: 死阿宅 你沒錢 收集樣本的代價是高昂的

Q:「AI會取代我嗎?」
A:會,AI 會取代問這個問題的人
邱銘彰

Machine 都在 Learning 了,你還不 Learning 嗎?
邱銘彰

Select a repo