1日目午後2:研修1部屋 === 日時:2017/09/23 16:00 - 17:30 Code for Japan Summit 2017 共有ノート # 文字情報基盤でBorderlessに広がる情報連携 平本 健二 / 田代 秀一 / 大山 水帆 **平本 健二さん 「社会における文字の体系」** 国内漢字環境の現状 - 公的に使用する漢字は文字情報基盤で既に相互運用可能となっている ○文字情報基盤 導入に向けたガイドブックを整備予定 (テクニカルではなくサービスの中での活用に向けたガイド) 文字データガイドブックの対象→氏名、法人名、地名、その他(書籍など) 代替文字 → マイナンバーや法人番号の導入に合わせて公的に代替を実施  → そもそも一意に代替できない 既に学校では戸籍氏名、氏名、ふりがな、英名を持つようになっている 資格、証明書、届出などの文字表記の検討 → 常用漢字じゃないと読めない事が多いので縮退の方がよい? → 正確性を求めるので戸籍氏名を求められるとスマホなどで登録ができない 文字の代替は避けて通れない デジタルファーストや外国人の増加などへの対応が求められる ○旧姓について ・旧姓利用が増えているがそもそも”旧姓”の定義は何を示すのか?   → 統一した見解が現状はない ○フリガナ・ローマ字問題 - グローバル化をにらみ、フリガナ・ローマ字は避けて通れない 住民票や戸籍にもともとフリガナが存在しない(出生届は事務上で付けているだけ) 戸籍:フリガナは不要 住民票:ふりがなは氏名の一部だという解釈 パスポートのローマ字は元々戸籍にないので自己申告制になっている 適切な代替文字がない場合のフリガナ運用(簡易化できない場合) - どう表記するかの統一ができない ローマ字の混沌 - 通常は訓令式が使われているが、パスポートはヘボン式 - 地名のローマ字表記もバラバラ(使われるシーンに寄っても違ったり...) ★コンピューターの普及に伴い先送りできない現状 → グローバル化、難読化、IT化にどう対応していくか *質問 Q 中国なんかはどうなってる? A 国が決めてしまっている ——————————— **田代 秀一さん** **「漢字6万文字の国際標準化が完了しました」** ○ 「文字を標準化する」とは? 昔はコンピューター上で文字を表現できるとは想像していなかった 1960年代頃から各国標準期間での文字標準化を開始 (文字と番号の対応関係を標準化→文字コード) (番号をどうコンピューターないで表現するか→エンコード) (どの範囲の文字を使うか→文字セット) 標準化Step1:文字を集める 標準化Step2:似た文字をまとめる(6年以上かかった!) 標準化Step3:ISO/IEC SC2へ提案する 何故大変か? → 漢字はややこしい   字種 → 字体 → 字形 ・・・ どこに文字番号を与えるか?  ※アルファベットは形は大した問題ではない Step4:異体字認識符号をつける 字体・・・UCSコード & 字形・・・VSコード = 完成! 文字情報基盤、よくある誤解  ・フォントをIPAmj明朝フォントに置き換えること? →文字を固定する事が本質( MJ文字固形名、ISO/IEC 10646符号+IVSで識別) →様々なフォントデザインがあることが健全 ・6万文字全てを使う必要があるのか? →業務に必要に応じた最適な範囲を使う事が大事 *質問 Q:自治体がmj文字を使うには? A:住基ネット明朝 **大山 水帆さん** **「外字について」** 外字とは→フォントにない文字をユーザーが作ったモノ 昔は戸籍が手書きだった事がそもそもの原因 戸籍に登録された文字が正しい文字ので、勝手に修正する事が許されていなかった その後、住基ネットの普及に伴いイメージとして漢字を使うけれど、その場合ローカルでしか使えなかった → 文字情報基盤が必要になった 今までの外字と"同様"の漢字をほぼ網羅されている 現状の問題:導入事例が進んでいない →実装方法が分からない ●実装方法 ・単にJISX0213のベースフォントとして利用 → 可変長を意識する必要はない → IPAMJ明朝を使い続ければ字形の変化に対応可 ・暫定フォント → IVSに割り当てられた文字はユーザーエリアに格納 → IVSの課題を回避 ・IPAMJ明朝 + 外字ファイル → IPAMJファイルにも存在しない文字は外字 ・IPAMJ明朝 + 代替文字 → IPAMJファイルにも存在しない文字は縮退マップで代替 **このノートは誰でも編集可能です!ぜひ議事録取りに協力願います。**