--- title: 'Project documentation template' disqus: hackmd --- MoAir-OCR管理画面操作マニュアル === ## 改訂履歴 | バージョン | 更新内容 | 更新日 | 更新者 | | -------- | -------- | -------- | -------- | | 1.0.0 | 初期作成 | 2020.11.1 | NeoX | ## 利用開始前 - アカウント作成関連 新規アカウントを取得するには、下記のメールアドレスまでご連絡ください。 customer@neox-inc.com - 動作環境 - 利用可能なブラウザ:Google Chrome、Safari、Firefox - 利用可能なOS:Mac、Windows ## 目次 [TOC] ## システム概要 MoAir OCRは従来の光学式文字認識技術に基づいたオブジェクト認識技術を採用し、認識精度を大幅に向上させています。テンプレートを設定することで、お客様のニーズに合った識別ルールを柔軟に策定し、識別精度をさらに向上させることができます。MoAir OCRはユーザー体験を重視したデザインを採用した上、認識項目ごとに信頼性のある読取り結果を提供できる大量の認識ナレッジが蓄積されており、今まで人が対応していた読取り結果のレビュー業務のコストを大幅に削減し、RPAによるオフィスワークの自動化を実現するのに役立ちます。 機能概要 --- 紙の文字情報を自動で読み取ってデータ化するにはOCRの技術が欠かせません。そんな中、文字の認識処理工程にAI技術を組み込み、読取り精度を大幅に向上させたのがAI型OCRです。 実用においては、あらゆる文字情報を100%の精度で読み取れるわけではありません。MoAir-OCR管理ツールを活用し、ユーザーが文字確認・修正・辞書登録などの補助作業をすることによって、読取り精度を継続的に向上させていくのがこのサービスの特徴です。 はじめに、書類の読取り対象の項目を「辞書」としてシステムに登録する必要があります。辞書登録後、書類のフォーマット毎にテンプレートを作成します。読取り項目と辞書を紐づけることで、異なるフォーマットでも同じ項目なら読み取れるようになります。読み取れなかった項目がある場合、「範囲指定式辞書拡張機能」を利用して、読み取れなかった項目を手動で追加し、適切な設定を行うことで読み取れるようになります。 #### 辞書 数えきれない情報量の中からユーザーが抽出したい(有意義な)項目を正しく素早く抽出する機能です。一度登録すれば、さまざまな書類の項目抽出が可能になります。 - 新規追加 「追加」ボタンをクリックし、名称と内容を入力して新規登録します(入力例:名称欄に「会社名」、内容欄に「NeoX株式会社」を入力します)。一つの項目に複数の内容を紐づけることができます(1つの内容を入力して「追加ボタン」をクリックします)。複数の内容を登録すれば識別精度が上がります。また、作成した辞書は複数のテンプレートに使うことができます。  - 編集 「編集」ボタンをクリックすると、該当する項目に紐づく内容の追加編集が可能です。  - 削除 「削除」ボタンをクリックすると、該当する名称及び紐づいた内容も削除されるので、注意してください。  #### テンプレート - テンプレートとは 読取り対象の書類のフォーマット、読取り項目に応じたテンプレートを作成する必要があります。一回作成したテンプレートに読取り項目を追加すれば、その種類の書類読取りにカスタマイズされます。作成したテンプレートは名称変更、編集、複製、削除することが可能です。ただし、削除する際に関連した設定済みの項目の読取りができなくなるので注意してください。 - 新規作成 「追加」ボタンをクリックし、テンプレート名を入力して新規作成します。  - 編集 テンプレート管理画面の右にある操作列の「編集」ボタンをクリックし、それぞれのテンプレートを編集することができます。  - 読取り 「読取り」ボタンをクリックすると、範囲指定式辞書拡張機能画面に遷移します。詳細は下記の**範囲指定式辞書拡張**を参照してください。  - コピー より簡単に新規テンプレートを作成するには、「コピー」をクリックしてください。既存テンプレートに紐づいている読取り項目属性や関連辞書などの設定情報も含め新しいテンプレートにコピーされるので、一から情報を設定しなくて済みます。  - 削除 「削除」をクリックすると、そのテンプレートに設定された読取り項目や項目属性などの情報も削除されます。削除する際に関連した設定済みの項目の読取りができなくなるので、注意してください。(紐づいた辞書の情報は削除されません。)  #### 読取り項目設定 - 新規項目追加 テンプレートの「編集」ボタンをクリックすると、テンプレート内の詳細読取り設定を変更することができます。プロジェクト管理画面の「追加」ボタンをクリックすると、読取り項目追加のポップ画面が表示されるので、まず項目の名称、エリアス名を入力します。次に、値の名称や値のタイプを指定し辞書を作成します。そしてその項目に使われるキー辞書を選択し、紐づけます。(値の辞書はユーザーが設定します。) | 設定項目 | 設定内容 | | -------- | -------- | | 名称 | 項目(キー)の名称 | | バリュータイプ | キーに対応する値のタイプ指定です(文字、数字、日付など)。 | | 辞書 | 1つの項目名称に異なる呼び方が存在する場合、設定してください(「金額」という項目に対し、「合計」、「合計金額」などのような呼び方が存在するケースです)。 |  - 編集 「編集」ボタンをクリックすると、設定した読取り項目内容を変更することができます。その変更内容は辞書が適用されたテンプレートにも反映されることにご注意ください。<br/>  - 削除 「削除」のボタンをクリックすると、設定した読取り項目が削除されます。削除すると、適用されたテンプレートにおいても、その読取り項目の設定が無効になり、識別ができなくなる恐れがあるため、注意してください。<br/>  #### 範囲指定式辞書拡張 - OCRエンジンとの互換ロジック 範囲指定式辞書拡張機能は、既存OCRエンジンでは対応してない新しい項目を、あらかじめ手動でOCRエンジンに登録し、学習させることで対応できるようにする機能です。これもAI型OCRソフトの特徴的な手法です。 - 新規識別範囲指定 テンプレート管理画面のテンプレートの「読取り」ボタンをクリックすると、範囲指定画面に遷移します。対象書類ファイル(.png/.jpgのみ)をアップロードし、画像が正しく表示されたら、右上の「確定」ボタンを押して画像を読み込みます。<br/>   - 読み取りたい項目の設定 「範囲指定」ボタンをクリックし、範囲指定モードに切り替えます。読み取りたい項目をちょうど囲むようにドラッグアンドドロップし、表示されたポップ画面から項目の設定を行います。 | 設定値 | 設定内容 | | -------- | -------- | | 選択項目 | テンプレートで設定した読取り項目を選んでください。 | | 識別結果 | 囲まれたテキスト情報が表示されます。手動修正が可能です。| | 新規項目 | 選択項目リストになければ、「+」ボタンをクリックし、新規作成してください。 | | 項目属性 | 囲まれた内容により項目名称または値のどちらかを選択してください。 |   - 結果確認 すべて読み取りたい項目の設定を完了したら、テストを実行します。右サイドに範囲指定した対象項目の読取り結果一覧が表示されます。識別結果に誤認識があった場合、手動で修正を行い正しい結果を保存すれば、項目の読取りルールが新たにOCRエンジンに追加されます。 #### ログイン - ユーザータイプと権限 ログイン画面から、アカウントとパスワードを入力して、ログインします。 ログインに困った場合、弊社までお問い合わせください。 customer@neox-inc.com #### 応用事例-保険証明書の読取り - 読み取りたい項目を追加する処理<br /> **①辞書から追加する場合**<br /> Step1. 例えば、生命保険料控除証明書を読み取るとします。辞書管理画面の「追加」をクリックし、「名称」に保険証明書、「内容」に生命保険料控除証明書を入力し登録します(「内容」には証明書に実際に記載された情報を入力することです)。   ※該当する名称が既に存在する場合、「編集」ボタンより編集することもできます。<br /> Step2. すべての読み取りたい項目の登録が完了したら、テンプレート管理画面の「読取り」ボタンをクリックし、範囲指定式辞書拡張画面に遷移します。<br /> <br /> Step3. 読み取りたい保険証明書をアップロードします。テスト機能を利用し正しく読み取れたことが確認できたら、保存してください。<br /> **②範囲指定式から追加したい場合**<br /> Step1. テンプレート管理画面で保険証明書テンプレートを選択し、「追加」ボタンで読み取りたい項目”証明額”を追加します。該当するバリュータイプとキー辞書も併せて設定します。 <br /> Step2. 項目設定を完了したら、テンプレートの「読取り」ボタンをクリックし範囲指定式辞書拡張画面に遷移します。<br /> <br /> Step3. 保険証明書画像をアップロードし、右上の「確定」ボタンをクリックしたら、画像が読み込まれます。<br />  <br /> Step4. 右側に読取り結果一覧が表示されます。読取り結果をクリックすると、画像上のどの項目に対応するかは番号で判断できます。<br /> <br /> Step5. 読み取れなかった項目の属性設定を行います。例えば、下図で示した通り、「一般申告額」と「介護医療申告額」と二つの項目を追加するとします。左クリックを押しながら「一般申告額」を囲んで、表示されたポップ画面より項目の属性を設定します(識別結果、項目選択及び属性)。設定ができたら、右の範囲指定した内容一覧に表示されます。<br />   <br /> 「介護医療申告額」も同様に設定します。<br />  ※項目選択のリストには先ほど追加した”証明額”が表示されます。実際の運用において、設定したい選択肢が表示されなかった場合は、辞書管理画面で先に追加してください。<br /> Step6. テストを行います。「テスト」ボタンをクリックしたら、下図が示した通り、読取り結果が表示されます。「保存」ボタンをクリックすれば、読取り結果が保存されます。<br />   ※++テストを実行せず保存すると、下図のような注意メッセージが表示されます。その場合、一回テストを行ってから保存してください。++<br /> 
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up