Translation issue of short vocabulary
-- WikidataCon 2023 Lighting Talk
# Outline
* Issues with machine translation 機器翻譯的短詞彙問題
* Wikidata way 使用 Wikidata 翻譯
* Google fight between machine tranlastion & wikidata 比較結果
* Summary 結論
## Issues with machine translation 機器翻譯的問題

The image shows a black silhouette of an adult and a child surrounded by a red circle. The adult and child are standing hand in hand.
❌ Optimistic about children 對你的兒童的未來保持樂觀
👌 Watch your children 看好兒童

## Another example of machine translation 機器翻譯的問題2
Italian coffee machine = 義式咖啡機?

American coffee machine = 美式咖啡機?

Italian coffee machine?
## Wikidata way

espresso machine = 義式咖啡機
## Google fight

| Keyword | Row count of Google search |
| -------- | -------- |
| "Italian coffee machine" | 6,270 |
| "espresso machine" | 250,000 |
## Enter a longer article for machine translation
輸入長一點文章 Made by ChatGPT
義式咖啡機是一種能夠釋放咖啡真正精髓的奇特裝置。它的設計靈感來自於義大利的咖啡文化,通過高壓抽取的方式,將咖啡豆中的香氣和風味完美地展現出來。一台優質的義式咖啡機不僅能夠提供給你早晨所需的活力,還能夠成為家庭和辦公室中的社交焦點。 義式咖啡機的外形設計通常緊湊,別具一格,往往能夠融入任何現代或是傳統的裝潢風格中。操作上,它要求咖啡愛好者投入一點時間和精力去學習,但當你一旦掌握了它的要領,便能夠輕易地煮出濃郁而香滑的義式咖啡,享受到每一個溫馨的咖啡時刻。

espresso machine = 義式咖啡機
## Using Chatbot
Prompt for Bing Chat (GPT-4)
I will provide you with a few tasks. My keyword is "xxx".
1. Search the English Wikipedia for the corresponding entry name.
2. With the English Wikipedia entry name, search for the Chinese entry name.
3. Search WikiData for the keyword's corresponding English and Traditional Chinese entry names.
中文版本 Prompt
1. 搜尋英文維基百科,對應的條目名稱
2. 將英文維基百科條目名稱,搜尋中文條目名稱
3. 搜尋 WikiData 關鍵字對應的英文和繁體中文條目名稱

## Summary
| Approach | Short Phrases | Long Articles |
| -------- | ------------- | ------------- |
| Machine Translation | Lacks context and may translate too literally, leading to errors | Possibly ok |
| Wikipedia/Wikidata | ok | N/A |
| 方案 | 短詞彙 | 長文章 |
| -------- | -------- | -------- |
| 機器翻譯 | 缺乏情境字面上直接翻譯而出錯 | 可能ok |
| Wikipedia/Wikidata | ok | N/A |
