# 讓世界看見你的資料— TaiBIF 與生物多樣性資料開放 作者:劉璟儀(內容經理)、何芷蔚(博士後研究員)、端木茂甯(助研究員兼代理執行長) 單位:中央研究院生物多樣性研究中心|TaiBIF ## 當開放資料遇上生物多樣性 隨著資料開放觀念的興起並越趨受到重視,各個研究領域都逐漸結合巨量資料的應用,拓展出新型的研究方法或工具。無論是大數據或統計分析、模型建立、機器學習,甚至是近期話題度爆高的AI人工智慧的開發,大多仰賴大規模的開放資料作基底。 生物多樣性領域也不例外,近年來,越來越多的生物多樣性研究不僅只透過田野調查取得資料,更結合開放資料讓研究的視野擴大;許多學者也開始跳脫傳統科學研究思維,結合科技走向新型態的生物多樣性資料應用,如聲音資料、衛星遙測、eDNA等,讓研究尺度在時空或物種上有機會能拓展延伸。 廣義而言,生物多樣性資料是指任何跟生物相關的資料,舉凡野外調查記錄到的各種生物、採集的標本、拍攝的物種照片或影片、錄到的聲音檔,乃至從生物體抽取的DNA或在土壤中擷取的環境DNA,都屬於生物多樣性資料的一環。總歸來說,資料的來源主要有四個途徑,分別為個人研究/生態調查、自然史標本典藏、政府監測計畫,以及公民科學。 那開放資料是什麼?通常我們會先提到2016年Wilkinson及Mons等人發表於Scientific Data期刊內的論文中所定義的「FAIR原則」:意即資料若要符合開放的概念,必須要**找得到(Findable)**、**拿得到(Accessible)**、**可互用 (Interoperable)**、**可再用(Reusable)**。詳細地說,就是資料能在網路上被搜尋並可下載,同時提供的資料格式是有依據標準且可與其他來源的資料整合,也有**開放授權聲明**允許任何人將資料重新再利用;  ==圖1 資料的FAIR原則。 by SangyaPundir (採CC-BY-SA 4.0授權)== ## 到哪裡開放與取用資料?TaiBIF與GBIF 在尚未有成熟大數據概念的時代,經濟合作暨發展組織(OECD)下的生物多樣性資訊小組建議道:「國際間需要建立可以自由存取生物多樣性資料、資訊的機制,藉由提供可靠正確的科學證據,可為經濟、社會帶來益處並促進永續發展。」於是,全球生物多樣性資訊機構(Global Biodiversity Information Facility, GBIF) 便背負著這樣的期望,在2001年正式成立,並由多國政府共同簽署合作備忘錄(MOU)加入成為會員並設立節點(Nodes),以「提供大眾無論何時何地,均能公開且自由存取有關地球上各種生物的資料」為宗旨,建立了整合全球的生物多樣性資訊開放平台(GBIF.org)和相關資訊基礎建設。 而臺灣在 GBIF 2001 年成立之初,便率先由我國國家科學委員會(國科會)與其簽署 MOU 成為初始會員,並於中央研究院成立「臺灣生物多樣性資訊機構」(Taiwan Biodiversity Information Facility, TaiBIF),不僅是推動國內生物多樣性資料整合及流通的單位,更是臺灣與國際生物多樣性資訊連結的重要窗口。除了推展 GBIF 的策略目標,引進國際共通的資料標準與工具、資料授權與開放的概念,也建立了與GBIF網絡串連的生物多樣性資訊基礎建設,提供可自由開放取用生物多樣性資料的入口網站,串起理想的資料生命週期。 TaiBIF 目前對外提供的服務主要有四個,分別為 1. **TaiBIF 官網**(taibif.tw):提供國內生物多樣性開放資料搜尋、資料開放概念介紹及發布資料的相關引導、相關新聞及推廣活動發布,以及TaiBIF開發的資料清理工具等內容。不僅能讓資料使用者看到臺灣的資料開放現況,亦可檢視物種分布資料地圖,同時也能閱讀資源,獲取相關知識。 2. **資料發布工具 IPT** (ipt.taibif.tw) :是目前國內開放資料並與國際平台GBIF連結的唯一管道,除可上傳及開放自己的生物多樣性資料,也可以是免費的個人生物多樣性資料倉儲及管理的空間,亦提供版本管理的功能,讓使用者方便管理不同的資料發布版本。 3. **TaiCOL 臺灣物種名錄**(taicol.tw):透過各物種類群的分類學專家的名錄審訂,此資料庫提供了國內的所有物種有效學名及分類資訊搜尋,還可檢視學名變動的歷史及相關文獻。為目前國內生物多樣性領域工作者確認物種學名的重要參考依據。 4. **物種學名管理工具**(nametool.taicol.tw):為名錄資料管理與分類資訊紀錄的網頁平台,除了名錄的整合查詢檢視,其管理流程貼近分類學者的工作流程,包含管理學名名錄與文獻資訊的功能,並可產出發表文章的分類處理架構等,也是提升分類資訊更新的工具,另提供專有名詞說明,以期降低分類學研究的門檻。  ==圖2 TaiBIF 官網首頁。來源:TaiBIF 臺灣生物多樣性資訊機構== GBIF 在過去二十年的努力下累積了超過二十二億筆的開放資料,也支持了全球生物多樣性研究及保育政策制定與決策;而臺灣目前於 GBIF 資料平台上開放的資料已超過一千五百萬筆,資料量位居亞洲第二。然而,在資訊基礎建設逐漸完備並累積了巨量的資料後,緊接而來的是另一個階段的挑戰,包括彌補資料在時空間與類群分布上的空缺、處理新興生物多樣性資料及與傳統資料來源的互補、提升資料品質,以及增加資料於研究與政策上的應用等。面對這些挑戰,TaiBIF 除持續針對上述問題提出解方,亦希望以過去累積的經驗與技術,領導國內生物多樣性資訊學的發展、協助政府達成永續發展目標願景,並主導 GBIF 亞洲區域事務的推動,提升臺灣在國際生物多樣性資訊研究領域的能見度。  ==圖3 在臺灣發布者的努力下,累積了足以點亮台灣輪廓的巨量資料。來源:GBIF.org== ## 開放生物多樣性資料的重要性 你可能會問,為何要開放資料?累積大量資料能做什麼?我們可從四個層面來看。首先,對全球生物多樣性而言,2022年生物多樣性公約締約方大會(COP)正式通過《昆明 – 蒙特婁全球生物多樣性框架》與 23 項後 2020 目標,其中第21項目標明確指出要確保能取得之最佳生物多樣性資料、資訊與知識,得以用來指引生物多樣性的管理與治理。也因此,資料的開放、流通與整合,以及從資料擷取資訊,到產生知識以支援政策制定,將會是全球 2030 年之前的重要工作之一。 其次,對政府決策單位來說,資料的整合開放不僅能成為重要的保育決策依據,甚至可透過物種的分布了解人畜共通疾病的傳染及擴散模式,有利於協助疾病的監控;再者,對組織來說,資料共享的前提需要團隊內部將資料作標準化、系統化的管理,除了有利於內部的資料彙整和永續管理,在資料標準及格式統一的狀態下,也能更容易地與其他單位溝通合作。 最後,對個人研究者來說,與其他研究者相互共享資料,能讓辛苦調查所取得的資料發揮最大的研究價值,增加研究的時空尺度,也更能看到全面性的生物多樣性樣貌。若開放資料到全球生物多樣性資訊平台,亦可提高研究資料的能見度,促進更多的交流合作機會,進而獲得更多經費支持。此外,還可藉由發表資料論文(data paper),讓更多人引用你的研究資料。 ## 一石二鳥,開放資料也能發表 所謂資料論文,係描述開放資料集的同儕審查(peer-review)文章,跟學術文章架構不同的是,它不需要完整的科學論證,只需表達資料集的開放位置、內容摘要、採集資料的方法、涵蓋的地點時間物種範圍,以及強調該資料集的生物多樣性應用價值等。目前有許多專門發表資料論文的資料期刊(data journal),如Scientific Data、Biodiversity Data Journal等,如同學術論文,這些期刊也一樣有臺灣學術圈重視的影響係數(Impact Factor),可獲得學術點數並彰顯研究人員,甚至資料管理人員的貢獻。 發表資料論文,還有個最主要的好處,是將你的資料作更結構化的描述,讓其他人能輕易看懂,也就增加了能見度與可信度,並最大化資料的價值。另一方面,有時收集到的資料不一定都能發表成學術論文,而資料論文便能讓你的每一筆資料都適得其所。 ## 如何將開放資料應用到研究上?臺灣的案例分享 時至今日,在 TaiBIF 與許多夥伴單位(如林務局、特有生物研究保育中心等)共同推動開放資料的氛圍下,使用臺灣開放資料來做主題研究的論文發表已橫跨各生態領域,研究主題除了分類學、生態學及生物地理學等基礎研究之外,也有探討氣候變遷、外來入侵種衝擊等重要社會與環境議題的研究。目前(截至2023年3月中旬),通過 GBIF 的文獻追蹤系統來追蹤全球使用 GBIF 資料的研究論文中,有 146 篇來自臺灣學者的參與,另有至少 47 篇發表已使用了從臺灣發布的開放資料。 接著分享幾篇應用TaiBIF和GBIF上開放資料的研究案例: 1. 透過自然史典藏資料,探討物種分布模式:中研院吳士緯博士、沈聖峰博士等人利用特生中心在 GBIF 發布的蛾類典藏資料集,結合AI尋找蛾類色彩多樣性和海拔高度與溫度的相關性。研究結果發現在高海拔及低溫的環境下,蛾類的色彩多樣性越低,並藉此預測蛾類在不同海拔的分布模式。文章已在2019年發表於*Nature Communications* 期刊。(https://www.nature.com/articles/s41467-019-12500-2#citeas) 2. 結合公民科學資料,驗證動物遷徙模式:中研院蔡佩妤、端木茂甯博士及特生中心柯智仁等人,從公民科學 eBird 資料,分析臺灣繁殖鳥類在不同季節的海拔分布變化,呈現出過去難以觀測到的遷徙模式,並結合鳥類行為與形態特徵,驗證了多個海拔垂直遷徙的假說。此篇已在2020年發表於*ECOGRAPHY* 期刊。(https://doi.org/10.1111/ecog.05196) 3. 運用氣候及物種開放資料,預測氣候變遷的影響:特生中心呂明倫博士及黃靜宜,從GBIF及其他開放資料庫的資料,預測氣候變遷對臺灣特有種—信義熊蜂(*Bombus formosellus*)的負面影響,以及合適的山區棲息地。推論在臺灣山區的暖化越趨顯著下,將不適合信義熊蜂棲息,可能因而滅絕。此文章2022年發表於*Journal of Insect Conservation* 期刊。(https://link.springer.com/article/10.1007/s10841-022-00415-1) 4. 利用系統性調查資料,建立國家鳥類指標:特生中心與中華鳥會運用「臺灣繁殖鳥類大調查」的資料,分析2011-2019年間的100種繁殖鳥類在臺灣的數量變化趨勢,並建置「臺灣森林鳥類指標」及「臺灣農地鳥類指標」兩項國家級指標,作為監測臺灣繁殖鳥類生存狀態及保育成效的重要儀表板,為亞洲第二個發布複合物種指標的國家。本篇已於2023年發表於*Ecological Indicators* 期刊。(https://www.sciencedirect.com/science/article/pii/S1470160X22013127) 除研究外,國內政府部門也越來越重視開放資料的應用,開始跟學者合作分析資料並作為保育決策(如保護區設置)的參考。2021年中研院生多中心與國內管理生物多樣性資料庫的公家單位成立生物多樣性資訊聯盟(Taiwan Biodiversity Information Facility, TBIA),包括林務局、特生中心、林試所、海保署、營建署、臺博館與水利署,並由TaiBIF團隊擔任開發及維運的角色,提供整合各單位資料庫所需的技術及基礎建設,支援更多生物多樣性的應用發展。 隨著生物多樣性資訊逐漸受到重視,相信未來相關的應用研究會更加多元且創新,甚至可樂觀地迎接新研究時代的來臨。然而,不論這些研究應用如何革新,TaiBIF 都將為不同受眾的需求存在著,並給予最大支持,成為資訊基礎建設最強而有力的推動者。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up