# 201911. Week11-2 word2vec ###### tags: `word embedding` ## 程式碼及相關檔案 * 程式碼 >https://colab.research.google.com/drive/1Z1uC1-uuPOqHfsMEQsxdWIZU3zjESBrd * 教學檔案 >https://drive.google.com/open?id=11snVD3XxCoQl81nPPNE_wY5W9yMIDnUN 大家下載整包到自己的 Google Drive,並用 colab 打開就能使用了,因為容量的關係,觀看前可以先打開py檔,下載資料到google drive上 ## 教學影片 1.https://www.youtube.com/watch?v=TPBR5DP2H-U 2.https://www.youtube.com/watch?v=NhrlwxYu9iw 3.https://www.youtube.com/watch?v=VIZeFjVJaHY&t=34s 這次的程式碼會分成3個: 1. word embedding 概念 2. skip-gram model實作 3. embedding_features後續應用 ## 教學用程式碼邏輯 1. 首先會先載入維基資料庫,並轉換成套件可執行的txt檔, 2. 進行NLP數據前處理,包含切詞與刪除停用語 3. 訓練model,衡量模型成效 4. 將文本資訊轉成embedding向量以利後續分析 * 停用詞檔案 https://drive.google.com/open?id=1gGQZTPtnXf88IYm84w2vsGwbtia4BmLS
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up