# 引得市全文檢索資料製作規範(正規化) --- ## 一、輸入文字與符號 輸入時儘可能使用可直接顯示的文字與符號,必要時再以「造字(缺字)」或「圖形字」來補充。避免誤以為電腦缺字,可先用[「部件檢索」](http://www.mebag.com/index/word_search.htm)查詢看看。 - 每一個簡號釋文內容,若有多行不必按enter斷行。上下段必須連接(連續),斷行部份以「↵」符號表示。在資料庫前端呈現時會自動隱藏此符號,並能依符號位置來斷行。 - 【遣】在資料庫前端可呈現「<span style="border:0.1em solid">遣</span>」的樣貌。 - 其餘可輸入符號如下:「┘丿㇏└〼╱▂⊠◎□.【】」 - 釋文之間若有空格以「全形」空格為準 --- ## 二、缺字或圖形字 - 擴張字C(含)以上的字,請至[「古文字缺字資料庫」](http://www.mebag.com/index/quezi/list.asp)查詢編號,須新造字以d為代號,依序d1…d2編號。筆者會依據內容造字,再給予缺字編號。 - 原書若有「圖形字」,則依目前[圖形字規範](https://hackmd.io/W8tepVScRGaswNAA_2X6Xw),為其命名。 (![](https://i.imgur.com/8slZfkG.png) ---- ## 三、其他(待補) 以上規範已使用在《里耶秦簡(壹)》、《里耶秦簡(貳)》釋文全文檢索。文獻數位化時,若使用者還有目前文字與符號之外的必要內容,請聯繫我們,以補充修正規範。 --- ## [引得市「合作提案」內容](http://hackmd.io/s/HJ_qFWLNx) --- ###### tags: `ocr 文字識別 電腦 軟體 工具 檔案`檔案`file`檔案同步 部件檢索 正規化