Try   HackMD

引得市全文檢索資料製作規範(正規化)


一、輸入文字與符號

輸入時儘可能使用可直接顯示的文字與符號,必要時再以「造字(缺字)」或「圖形字」來補充。避免誤以為電腦缺字,可先用「部件檢索」查詢看看。

  • 每一個簡號釋文內容,若有多行不必按enter斷行。上下段必須連接(連續),斷行部份以「↵」符號表示。在資料庫前端呈現時會自動隱藏此符號,並能依符號位置來斷行。
  • 【遣】在資料庫前端可呈現「」的樣貌。
  • 其餘可輸入符號如下:「┘丿㇏└〼╱▂⊠◎□.【】」
  • 釋文之間若有空格以「全形」空格為準

二、缺字或圖形字

  • 擴張字C(含)以上的字,請至「古文字缺字資料庫」查詢編號,須新造字以d為代號,依序d1…d2編號。筆者會依據內容造字,再給予缺字編號。
  • 原書若有「圖形字」,則依目前圖形字規範,為其命名。

(

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →


三、其他(待補)

以上規範已使用在《里耶秦簡(壹)》、《里耶秦簡(貳)》釋文全文檢索。文獻數位化時,若使用者還有目前文字與符號之外的必要內容,請聯繫我們,以補充修正規範。


引得市「合作提案」內容


tags: ocr 文字識別 電腦 軟體 工具 檔案檔案file檔案同步 部件檢索 正規化