[RFC] Multilingual names
目前多國語系的 name 標籤 (tag),社群偏好使用 alpha-2 code of ISO 639-1,因此全世界中文用戶使用 name:zh。但由於中文用戶包含簡體與繁體兩種字體編碼,以及對於國際地名翻譯不同,很容易因為共用標籤 key 產生衝突。例如 Everest 在台灣使用者偏好使用「聖母峰」、而中國使用「珠穆朗玛峰」。
為了滿足多元使用情境與需求,原有 ISO-639 標示過於簡化,建議 name 標籤使用 IETF language tag (BCP 47) 標示多國語系,以容納各地區地名使用習慣,以及繁體、簡體、閩南、客家、廣東話、台灣原著民、拼音等語言需求。
在此倡議使用 IETF language tag (BCP 47) 語法形式。語法形式包含了如下 subtags.
- A single primary language subtag based on a two-letter language code from ISO 639-1 (2002) or a three-letter code from ISO 639-2 (1998), ISO 639-3 (2007) or ISO 639-5 (2008), or registered through the BCP 47 process and composed of five to eight letters;
- Up to three optional **extended language subtags** composed of three letters each, separated by hyphens; (There is currently no extended language subtag registered in the Language Subtag Registry without an equivalent and preferred primary language subtag. This component of language tags is preserved for backwards compatibility and to allow for future parts of ISO 639.)
- An optional **script subtag**, based on a four-letter script code from ISO 15924 (usually written in title case);
- An optional **region subtag** based on a two-letter country code from ISO 3166-1 alpha-2 (usually written in upper case), or a three-digit code from UN M.49 for geographical regions;
- **Optional variant subtags**, separated by hyphens, each composed of five to eight letters, or of four characters starting with a digit; (Variant subtags are registered with IANA and not associated with any external standard.)
ABNF 語法如下
依照 IETF language tag (BCP 47) 標示,建議做出以下更動
OpenStreetMap 是一個使用標籤描述地理資訊的開源地圖專案,而標籤以後綴的形式支援多國語系,例如 name:en 代表英文名稱,為便於討論後綴所以整理成本表格。各語系使用如下 (好讀版本)
Mandarin 華語系 | |||
---|---|---|---|
:zh | Mandarin | 台灣境內使用繁體中文、中国境内使用简体中文。國際地區則無共用規範產生衝突。 | |
:zh-TW | 建議使用 :zh-Hant-TW 。預設是繁體中文 | ||
:zh-Hant-TW | |||
:zh-Hans-TW | 適合在台灣使用簡體字的用戶。 | ||
:zh-CN | 建议使用 :zh-Hans-CN 。默认是简体中文 | ||
:zh-Hans-CN | |||
:zh-Hant-CN | 适合在中国境内使用繁体字的用户。 | ||
:zh-HK | 建議使用 :zh-Hant-HK 。預設使用繁體中文,由於香港政權交接中國,受政治影響部份民眾改用簡體字。 | ||
:zh-Hant-HK | |||
:zh-Hans-HK | |||
:zh-MO | 建議使用 :zh-Hant-MO 。預設使用繁體中文,由於澳門政權交接中國,受政治影響部份民眾改用簡體字。 | ||
:zh-Hant-MO | |||
:zh-Hans-MO | |||
:zh-SG | 建议使用 :zh-Hans-SG 。1976 年后改用中国规范的简体字。预设使用简体。 | ||
:zh-Hans-SG | |||
:zh-Hant-SG | |||
Other Sinitic 其他漢語系 | |||
:nan | Minnan | 閩南語, Holo-oe, Ban-lam-gu, Mǐnnán | 因為閩南話次方言各地演化產生變異,漳州話、泉州話、廈門話略有不同。台灣地區建議使用 :nan-TW |
:nan | |||
:nan-Hant | |||
:nan-Hant-TW | |||
:nan-Latn-pehoeji | |||
:nan-Latn-TW-pehoeji | |||
:nan-Latn-tailo | |||
:nan-Latn-TW-tailo | |||
:nan-TW | 考慮用戶族群,建議使用台羅拼音,並以中華民國教育部出版的《臺灣閩南語常用詞辭典》選定最接近通行腔的「高雄音」做為主音讀。 | ||
:hak | Hakka | Kèjiā, 客家 | 台灣地區建議使用 :hak-TW |
:hak | Hakka | Kèjiā, 客家 | |
:hak-Hans | |||
:hak-Hant | |||
:hak-Latn | |||
:hak-Hant-TW | |||
:hak-Latn-TW | |||
:hak-TW | |||
:yue | Cantonese | ||
:yue-Hans | |||
:yue-Hans-CN | |||
:yue-Hant | |||
:yue-Hant-HK | |||
:yue-HK | Cantonese | 香港地區建議使用 :yue-Hant 、 :yue-Hant-HK | |
:yue-CN | Cantonese | 廣東等地區建議使用 :yue-Hans 、 :yue-Hans-CN | |
:cdo | Mindong | 閩東話, 福州話 | |
:cjy | Jin | 晉語 | |
:gao | Gan | 干彝寨方言 | |
:hsn | Xiang | 湘語:吉溆 | |
:cmn | Mandarin | 漢語 | 未用, 預設 :zh |
:cpx | Pu-Xian Min | 莆仙語,興化語 | |
:czh | Huizhou Chinese | 徽州話 | |
:czo | Minzhong | 閩中語 | |
:lzh | Literary Chinese | 文言文 | |
:mnp | Minbei | 閩北語 | |
:wuu | Wu | 吳語 | |
Austronesian, 南島語系, Indigenous Taiwanese | |||
:ais | Sakizaya | Sāqíláiyǎ, 撒奇萊雅 | |
:ami | Amis | āměi, 阿美, Pangcah | |
:bnn | Bunun | Bùnóng, 布農, Bunun | |
:ckn | Kavalan | Gámǎlán, 噶瑪蘭, Kebalan | |
:dru | Rukai | Lǔkǎi, 魯凱, Drekay | |
:pwn | Paiwan | Páiwān, 排灣, Payuan | |
:pyu | Puyuma | Bēinán, 卑南, Pinuyumayan | |
:pyu | Shao | Shào, 邵, Thao | |
:tao | Tao | Dáwù, 達悟, Yami, Tao | |
:tay | Atayal | Tàiyǎ, 泰雅 | |
:trv | Truku | Taroko, 太魯閣, Tàilǔgé, 賽德克, Seediq | |
:trv | Tsou | Zōu, 鄒 | |
:xsy | Saisiat | Sàixià, 賽夏, SaiSiyat | |
:sxr | Hla'alua | Hla'alua, 拉阿魯哇 | |
:xnb | Kanakanabu | Kanakanavu, 卡那卡那富族 | |
Romanization, 拼音系統 | |||
:zh-Latn | 預設為漢語拼音,預設使用 name:zh-[region] or name:zh or name 之中文。 | ||
:zh-Latn-pinyin | 漢語拼音,建議使用 :zh-Latn | ||
:zh-Latn-tongyong | 通用拼音 | ||
:zh-Latn-TW-tongyong | |||
- | 台灣 國音一式 | ||
- | 台灣 國音二式 | ||
:zh-Latn-wadegile | Wade-Giles 羅馬拼音 | ||
:zh-Latn-TW-wadegile | |||
:en | 由於有多種拼音系統。目前於台灣無統一拼音方式。建議遵循當地政府的慣例使用,以符合觀光客對應本地圖資的需求。 | ||
:zh-Bopo | Bopomofo | 注音符號 | |
:zh-Bopo-TW | Bopomofo | 由於注音符號只有台灣地區使用,建議使用 :zh-Bopo。 | |
CJK Han 漢字 | |||
:ja-Hani | Han; Hanzi; Kanji; Hanja | Japanese Kanji | |
:ko-Hani | Han; Hanzi; Kanji; Hanja | Korean Hanja |
**影響 **
** 討論連結**
osm.tw 臉書社群貼文 https://www.facebook.com/groups/OpenStreetMap.TW/permalink/1020442338021235/
osm.tw 郵件論壇討論主題 https://lists.openstreetmap.org/pipermail/talk-tw/2016-March/001277.html
osm.cn 郵件論壇討論主題 https://lists.openstreetmap.org/pipermail/talk-cn/2016-March/000107.html
參考