# 「有感」素材 WikiData 應用編輯松 * 今日活動[線上簽到](https://outreachdashboard.wmflabs.org/courses/wikidatatw/「有感」素材_WikiData_應用編輯松_(20211114)?enroll=wikidatatw) ## 本頁面短網址:https://tg.pe/XFv ## 活動流程 9:30~10:00 準備、報到、交流 10:00~10:20 活動介紹 10:20~13:00 「有感」素材 WikiData 應用編輯松 13:00~14:00 交流餐會暨 CC 台灣社群聚會 ## Wikidata 教學 * [Wikidata 在數位人文的基礎概念與應用](https://slides.com/allenwang6212/wikidata-eb0793) * [wikidata 教學文件](https://hackmd.io/@wikidata-tw/BktuCH4hd) ## 工作坊教學 * 步驟一:挑選資料 * 可以在這邊找到:https://hackmd.io/@Yanyiyi/BJZ6BXKUY * 步驟二:閱讀資料,釐清要撰寫的metadata * 步驟三:圖片檔案轉傳 wikimedia commons * https://commons.wikimedia.org/wiki/%E9%A6%96%E9%A1%B5 * Category:20211114 wmtw x cctw workshop * 步驟四:wikidata 資料建置 * https://www.wikidata.org ## 工作坊任務分配 > 例: * Allen 顏國年 * c.台灣山林圖像:南湖圈谷_620114[name=aceralba] * d.基隆藝文:數位物件-臺灣水彩畫會_259108 [name=Yanyiyi] * a.鐵道:數位物件-桃園軌道株式會社車站前停靠輕便鐵道車輛_178318 [name=Yanyiyi] * d.基隆藝文:數位物件-石坂文庫_178941 [name=Yanyiyi] * c.山林:數位物件-觀高駐在所_325337[name=ㄐ] * d.基隆藝文:數位物件-葉獅_302123[name=rock] * c.山林:六龜分局桃源分駐所 [name=Singing] * b.原住民:歸順的外太魯閣副頭目(ソローカン)[name=weichen] * c.山林:大分瀑布_325409 [name=HuangFu] * c.山林:利稻部落_619363[name=ㄐ] * c.山林:八通關草原_325338[name=s8321414] * c.山林:拉古拉往大分的路上_325408 [name=HuangFu] * c.山林:志佳陽大山_620132[name=ㄐ] * b.原住民:布農族抗日英雄Dahu-ali(拉荷.阿雷[name=weichen] * c.山林:八通關駐在所_325339 [name=HuangFu] * b.原住民:布農族Qanituan(加年端,カネトワン)社巫師[name=weichen] 維基共享資源平台,在維基使用的圖片必須先已經存在在維基之中(已經上傳至平台) e.g.從國家文化記憶庫搬遷 今天會用手動的方式處理(轉移至維基,再做應用) Wikidata簡報 (略) 2012的維基媒體計畫,在共享資源後的第一個跨語言專案,過去不同語言的維基百科是不同站點且由不同的社群維護,wikidata則是所有的語言共同維護一個站點。 ### 為何中文會須要 Wikidata - 機讀友善 電腦是相對複雜的語言,e.g.列出台灣淡水河 也許會列出所有台灣淡水水域 多少標案與「維基」有關?他在搜尋到「運『維基』地」 中文的維基百科對於機讀相對不友善,WIkidata 的目的在於友善化機讀。 維基百科元素 閱讀需求,使得部分瑣碎資料會無法獨立紀錄與分述 e.g.劉厝埔(的四個分意) 同時在日治時期有三個行政區叫劉厝埔 wikidata內可以有四格條目,wikipedia僅會合併一則 (導入唯一識別碼~ 簡報) #### 三大重點 - Wikidata 機讀友善 - 權威詞彙對照 - 文本文獻資料庫化 樂信瓦旦(需要人名權威檔) 語言欄位連結各語言與各通名稱,並使用唯一識別碼互相溝通,提供權威對照功能 「亦稱為」欄位,等於提供「權威檔」的功能。 #### 跨資料庫對照的工作 需要兩個資料庫合併,資料的對照工作,許多時候都要進行資料庫對照匯入等 僅有兩個資料庫對照還可行,但當有數十個資料庫時,同時對照工作還牽涉到組織權責問題 對應到wikidata,D個資料庫之間對照僅要滿足 在維基媒體計畫內部,wikidata也扮演這多語言多計畫的 (不同的資料庫的交疊) 導出應用 對照 VIAF 早期與英文維基百科對照 wikidata的人文應用案例 「研究資料寄存所」(depositar) wikidata Module Omeka S (與wikidata對應的典藏管理軟體) MoMA提供基礎資訊 結構資料在處理與應用 e.g IFLA (Opp for Academic and Research) ARL (white paper for wikipedia) 李梅樹 資料庫不再只服務人,服務機器的資料庫趨勢 (以閱覽次數計算) 1700萬中文維基百科人的閱覽量/600萬 機器的閱覽量 除與人協作外也與機器人協作 Wikidata 可以有效降低 LOD 建置的成本。 人閱覽一次的同時,機器可能會閱覽更多次。 從外部跨資料庫連結可以節省成本。 wikidata (P,Q,L) 以國家人權博物館為例 label, code, multilanguage 台灣目前有支援(華語、客語、閩東、閩南、阿美、賽夏、撒奇拉雅等) 描述非常重要可以迅速分別不同的同名物件 e.g 楊三郎(畫家、作曲家) linked data, 每一個描述都是link 陳述(descrption) 性質(p31)是甚麼東西 圖片(p18)代表圖片是 etc... * 透過屬性連結兩種物件 (ex.性質、國家、行政領土、access....) * 連結實際的數值/內容 (官方名稱、母語標籤(以母語寫的名稱) * 連結外部連結跟資料庫 (官方網站、geogame編號等、VIAF id) ### 工作坊教學 四類寫法 even 八種or more 先挑一張照片 20211114 wmtw X cctw workshop - 第四步驟 wikidata建置 metadata 有一對一原則 - 有wiki辭條的作法 (以顏國年為例) 點開編輯之後,如果介面有中文應該有中文繁體跟中文台灣 標籤/顏國年 描述/基隆顏家人士 (有英文可以加英文) 亦稱為(可以skip) 性質/人 性別/(有多種選擇) 如果寫出生跟死亡日期請加上參考文獻 (來源網址/檢索日期/作品或名稱語言(中華民國國語) - 沒有wiki辭條的作法 建立新項目 英文/中文檔案 陳述(Statement)/隸屬於(instance of) (然後這個部分可以用搜尋來選擇/如果不是單純的下拉選單會顯示的人,地、物等) 加入圖像 (剛剛上船的圖像名稱,**.jpg) 國家:中華民國 其他可以自己加~ (依據剛剛下載的文字敘述) 轉成jason檔案 https://www.wikidata.org/enety/Q10*******.jason Query Service https://query.wikidata.org/ FAQ https://tw.creativecommons.net/tcmb/ http://wiki.twchapter.cc/doku.php 1. 檢查左邊是不是正確的系統。 2. 檢查右上角是不是有登入帳號