# 資料編碼與空值處理 以下說明計畫中主要人工整理資料類型的編碼方式,以兼顧人工查閱及機器識讀。 針對機器自動產生之原始資料檔案,因為資料內容通常由機器規格決定,因此除了檔案的命名外,尚不預期資料內容會使用到此編碼規格。 更新日期:2020-06-14 ## 符號說明 - 種類以英文字之第一或第一、二字母開頭;不可以數字開頭。 - 括號「()」用以說明縮寫字源,例如 St(ation) 表示以 St 代表 Station,填寫時只用 St。 - 符號「|」表示「或」,可能的選項以符號「[]」包圍,因此「[W|C]」表示在該位置可填「W」或「C」,實際填寫不可將符號「|」、「[」、「]」寫入 - YYYY 表示四位數年,例如 2019。 - MM 表示二位數月,例如 07、11,請注意補足二位數。 - DD 表示二位數日,例如 03、28,請注意補足二位數。 - nn 表示流水號,例如 01、02,請注意補足位數。若位數需要更動,或需要使用非數字,請與資料管理團隊聯絡。 - 各命名單元(以中括號包圍)以底線「_」連接。例如:` St_2019_W_ITRITest_CAcoustics_01`表示水下聲學 2019 年在海洋示範風場風場區的 01 號測站。 ## 控制詞彙 為命名規則中意義固定、不會變動之字串: | `Aves` 鳥類 | `Cetacean` 鯨豚 | `Benthos` 底棲生物 | | -------- | -------- | --- | | `AAcoustics` 鳥類聲學 | `All` 全航程 | **`Fish` 魚類** | | `ARadar` 鳥類雷達 | `Effective`有效航程 | **`CAcoustics` 鯨豚水下聲學** | | `ARinging` 鳥類繫放 | `Biological`鯨豚追蹤 | **`Fish` 魚類** | | `AThermal` 鳥類熱像儀 | | **`UNoise` 水下噪音** | ## 資料類型 以下編號用做資料表的主鍵(primary key)或檔名使用,以**足以辨認該類型、該筆紀錄唯一性之最少資訊**為原則。 - **風場編號**:`WindFarmID`(目前海洋風場填 ITRITest,未來其它風場需與工研院確認) - **測站編號**: `St(ation)_YYYY_[W|C]_[WindFarmID]_[Benthos|Fish|CAcoustics|ARadar|AThermal|AAcoustics|UNoise]_nn` - 例:2019 年度海洋離岸示範風場底棲生物對照區的 1 號測站編號記為 `St_2019_C_ITRITest_Benthos_01` - 單一類群所有測站之圖籍資料以年度彙整成一個檔案即可,例如:2019 年度海洋離岸示範風場魚類風場區測站的圖籍檔案檔名可記為`St_2019_W_ITRITest_Fish.shp`(檔案直接置放於計畫的資料夾中,而不放入個別作業規畫中)。 - **測線(航跡)編號**: `R(oute)_YYYY_[W|C]_[Benthos|Fish|Cetacean|CAcoustics|Aves|ARadar|ARinging|UNoise]_MMDD_nn_[All|Effective]` - `nn` 計數以該**年度**為單位累計,不同場區分別累計。 - `All` 從進港到出港的全航程 - `Effective` 該調查的有效航程 - 亦用於圖籍檔案(.shp, .gpx, etc.)命名。 - 例:2019 年 6 月 5 日鯨豚目視調查在海洋離岸示範風場對照區第 10 趟次之**全航程**,可編號為 `R_2019_C_ITRITest_Cetacean_0605_10_All`,該趟次之圖籍檔案可命名為`R_2019_C_ITRITest_Cetacean_0605_10_All.shp` - 例:2019 年 6 月 5 日鯨豚目視調查在海洋離岸示範風場對照區第 10 趟次之**有效航程**,可編號為 `R_2019_C_ITRITest_Cetacean_0605_10_Effective` 追蹤航跡與目擊事件有關,故流水號**位數**與目擊編號應一致: `R(oute)_YYYY_[W|C]_[Benthos|Fish|Cetacean|CAcoustics|Aves|ARadar|ARinging|UNoise]_MMDD_nnnn_Biological` - `Biological` 該調查追蹤生物的軌跡 - `nnnn`計數以**天**為單位累計 - 例:2019 年 6 月 5 日鯨豚目視調查在海洋離岸風場對照區第 3 次目擊紀錄的追蹤航跡,可編號為`R_2019_C_ITRITest_Cetacean_0605_0003_Biological` - 追蹤航跡之圖籍檔案不需按個別目擊紀錄輸出,以天為單位命名毋須加註目擊紀錄序號,例如:`R_2019_C_ITRITest_Cetacean_0605_Biological.shp` - **目擊編號**:`O(ccurrence)_YYYY_[W|C]_[WindFarmID]_[Cetacean]_MMDD_nnnn` - [Species Occurrence](https://dwc.tdwg.org/terms/#occurrence) 為物種出現紀錄,包含觀測、標本等所記載的物種點位及屬性,故此處以英文字母 O 為代號。 - 例:2019 年 6 月 5 日鯨豚目視調查在海洋離岸風場對照區第 3 次目擊紀錄,可編號為`O_2019_C_ITRITest_Cetacean_0605_0003` - **取樣點編號**:取樣點不同於測站,是依需求而在特定時間地點設定的位置進行取樣作業。編號規則與測站相同,惟首字以 Sa(mpleing) 區別之:`Sa(pling)_YYYY_[W|C]_[WindFarmID]_[Benthos|Fish|CAcoustics|ARadar|AThermal|AAcoustics|UNoise]_nn` - 例:2019 年 1 月 30 日的前三點取樣點:`St_2019_C_ITRITest_Cetacean_0130_01` `St_2019_C_ITRITest_Cetacean_0130_02` `St_2019_C_ITRITest_Cetacean_0130_03` - **生物/標本照片編號**:`I(mage)_YYYY_[Benthos|Fish|Cetacean|Aves|ARinging]_MMDD_nnnnnnnn` - **工作照編號**: `W(ork)I(mage)_YYYY_[Benthos|Fish|Cetacean|CAcoustics|Aves|ARinging|UNoise]_MMDD_nnnnnnnn` - **調查器材照編號**:`In(strument)I(mage)_YYYY_[Benthos|Fish]_MMDD_nnnnnnnn` - **影片編號(一般影片)**: `V(ideo)_YYYY_[Benthos|Fish|Cetacean|Aves|UNoise]_MMDD_nnnnnnnn` - **音訊檔編號**:`Re(corder)_YYYY_[CAcoustics|AAcoustics|UNoise]_MMDD_nnnnnnnn` - **雷達錄影檔編號**:`Ra(dar)_YYYY_[ARadar]_MMDD_nnnnnnnn` - **熱像儀錄影檔編號**:`T(hermal)_YYYY_[AThermal]_MMDD_nnnnnnnn` - **資料檔(Google Sheet)檔名**: `Sh(eet)_YYYY_[W|C]_[WindFarmID]_[Benthos|Fish|Cetacean|CAcoustics|Aves|AAcoustics|ARadar|ARinging|AThermal|UNoise]_MMDD_nn` ## 空值處理 - 有無:T/F - 0:有執行測量,測值為0 - 空值: - 空白(未填):未執行測量 - NA (Not applicable):有執行測量,但數值遺失或不可信(應在備註欄位註記) ## 工具 - A Better Finder Rename [ [macOS](https://www.publicspace.net/ABetterFinderRename/index.html) | [windows](https://www.publicspace.net/windows/BetterFileRename/index.html) ] 推薦用來批次修改檔名,可預覽,可深入子目錄。