Try   HackMD

與廣告帳戶間的頂尖對決 - CoreML、CreateML 在線上產品中做為輔助角色的應用案例

所有議程請見議程表

歡迎來到 https://hackmd.io/@iPlayground/2020 共筆

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

點擊本頁上方的 開始用 Markdown 一起寫筆記!
手機版請點選上方 按鈕展開議程列表。

請從這裡開始

與廣告帳戶直接的頂尖對決

Marvin Lin

故事爆料同學會

廣告帳戶的特徵

平日早上九點開始活動,中午十二點會停止,下午一點半開始

對方開始進化

如果直接封掉廣告關鍵字,對方會立刻做變化馬上發出來

  • 避開關鍵字
  • 換掉大頭貼
  • 帳號名稱合理
  • 會在一天內創大量帳號開始養
  • 尋找段時間提升等級的方法
  • 用 emoji / 同音

我方進化

  • 詞向量系統

CreateML 有自然語言分析

為什麼不交給機器學習小組

  • 他們負責金融相關的工作
  • 不確定用那種 NLP
  • 沒辦法立刻上手前端 API

使用 ML 的流程

  1. 定義問題
  2. 整理 Data
  3. 訓練模型
  4. 驗證
  5. 輸出 Model

700筆訓練資料,用一萬筆去測試,其中抓出五百筆廣告,有250筆是誤判成廣告
之後將剩下的資料拿去產生另一個 model,並另外用一萬筆新的資料測試,誤判率從50%降到23%,所以又做了第三個 model

TuriCreate 可以用 python 寫直接串接後端,並且有很多參數可以調,結果也會顯示信心值

結果:前幾次的結果都是 Swift 寫的 CoreML 比較高

為什麼要使用 CoreML、CreateML

  • 這個題目已經有對應的工具和方法
  • ML 小組沒資源
  • 前期做實驗

廣告的變化

  • 圖片
  • 圖片裡包 emoji
  • 圖片裡放投影片再放廣告內容
  • 用注音文
  • 偽裝成官方,放Logo
  • 用可愛的 LINE 圖
tags:iPlayground2020