翻譯句子 0.15 秒 Truecasesing feb ==> Feb (做成 api) ## 優先把字卡的問題處理好 ![image](https://hackmd.io/_uploads/H1HGHNFd6.png) 總共有 448 + 144 + 60 + 164 = 816 筆資料 4 個人,一個人選擇 200 筆資料來處理 ## 把 perl script 變成 python > 小寫變大寫,大寫變小寫 > proper name convert - [ ] 做完了打勾 (孟凱) ```bash # path: # /home/joshua/joshua/Translation_project/indonesian_translate_api/scripts/utils/perls/truecase.perl # 把這個 code 轉成 python # 建議先找找看網路上有沒有人先做過 # 關鍵字: mosesdecoder, subword-nmt # 對應的資料在 # /home/joshua/joshua/Translation_project/indonesian_translate_api/translation_file/id2zh_1013/truecase-mode.en ``` ## 增加 越南 -> 中文 翻譯模組 - [ ] 蒐集中文 -> 越南文 語料 - [ ] 蒐集資料 (溪崑) - [ ] 資料清洗 (熙堃) - [ ] 訓練 (孟凱) - [ ] 將訓練模組放到 model 中並建置 (孟凱) ## 增加 中文 --> 越南 翻譯模組 - [ ] 蒐集中文 -> 越南文 語料 - [ ] 蒐集資料 (溪崑) - [ ] 資料清洗 (熙堃) - [ ] 訓練 (孟凱) - [ ] 將訓練模組放到 model 中並建置 (孟凱) # 兩個名詞互相修飾的狀況是怎樣 問 kevin ==請邱老師的助理來幫忙測試== 一天可以測試 100 個句子 10 天左右可以測完 bubur gandum gandum bubur ![Uploading file..._ekauhgtwo]() 測試方法: 下載 kasih ==> 測試句子 ==> 截圖 存檔後給編號丟出來 # 翻譯重點整理 1. 網頁須更新可以觀看 log 的地方 2. log 必須計 3. 看能不能打 fairseq 轉到 gpu 上, *** 重點之一: 卡水必須 focus 在 資源頁面上