###### tags: `DX Innovation Challenge` # <center> KiKI 説明資料 </center> --- ## 1.0 一般情報 ### 1.1 目的 本資料は、DX-InnovationのチームEaglesのアイディアで使用された技術の一連の流れ、特徴、詳細を示すためのものである。また、本資料には、提示されたアイディアの将来的な開発価値も含まれている。 ### 1.2 スコープ この部分では、KiKIサービスの機能、性能、セキュリティ等の概説をする。 KiKI サービスは以下のことを行う。 - 会議やスピーチ、グループ内での会話などの音声の録音 - ユーザーの要求に応じた音声ファイルの分析、基準に基づいた評価、フィードバックの提供 - 専門の評価者による手動の音声ファイルの分析、評価とフィードバック この作品の範囲は、KiKIの初期のアイデアを含んでいる。将来的な開発の検討に関する言及は、この提案には情報提供のみを目的として含まれています。 ## 2.0 理想的なシステムの概要 KiKIのサービスを利用する際、各ユーザーは録音した音声ファイルをサーバーにアップロードして分析することができる。  上に示した図のように、ユーザーのデータはデータベースに送られ、バッチ処理される。バッチ処理では、データのフィルタリングや集計など、分析のための準備が行われる。データはAIと人間の評価者によって分析され、ユーザーは自分に合った評価とフィードバックを受け取ることができる。 リアルタイムの音声メッセージも同じように処理される。  ### 2.1 AIアルゴリズム 音声をテキストに変換するために、このシステムは[DeepSpeech](https://github.com/mozilla/DeepSpeech)というオープンソースのプロジェクトを使用する。 音声をテキストに変換した後、そのテキストをAIやニューラルネットワークで評価する。 関連する研究: - [Computerized paper evaluation using neural network](https://ieeexplore.ieee.org/document/8286032) - [Academic Paper Evaluation Software](https://www.researchgate.net/publication/297988426_Academic_Paper_Evaluation_Software) - [Algorithm research of spoken English assessment based on fuzzy measure and speech recognition technology](https://www.inderscience.com/info/inarticle.php?artid=105631) ### 2.2 Proof of Concept(概念実証)  その実現可能性を示すために、ここでは簡単なPoC(Proof of Concept)を紹介する。PoCの参加者は、ユーザー代表、ビジネスリーダー、プロジェクトリーダー、テクニカルアーキテクト、 テストエンジニア、ビジネスマネージャー等である。 #### 2.2.1 模擬 PoC (1~2 ヶ月) この段階では、テスト担当者は情報収集を行う。集めた情報には、製品に対する会社の要求が含まれるが、これに限定されるものではない。 #### 2.2.2 PoC - ステップ 1 (1-3 ヶ月) この段階では、開発者は収集した要件と事前計画に基づいてプロジェクトを開発する。開発には、AIアルゴリズムの記述、トレーニングサンプルを用いたAIのトレーニングと修正、テストセットの記述などが含まれる。 #### 2.2.3 PoC - ステップ 2 (1~3 ヶ月) この段階では、テスターやユーザーの代表者がシステムの機能をテストすると共に、フィードバックを行う。開発者は、フィードバックやテスト中に発生した問題点に基づいて、システムの最適化と修正を行う。 #### 2.2.4 PoC - ステップ 3 (1~3 ヶ月) この段階では、開発者は今回の PoC をまとめて評価し、次の PoC のための計画を立てる。 ## 3.0 機能要件と影響 ### 3.1 機能の概要 KiKIサービスでは、以下のような機能を持つデータ収集・分析システムが必要となる。 - データへのアクセス性 - ユーザーアカウント - データの整合性 - データ分析 - 管理パネル - システムセキュリティ #### 3.1.1 機能要件 上記の必要性を達成するために、KiKIサービスは、以下の基本機能を含む広範なデータ収集および分析システムのための技術ベースのソリューションを必要としている。 - データへのアクセス性 - ユーザーのデータ、評価、フィードバックが検索可能なWebサイト(グループ設定を公開にしている場合) - グループやユーザーの分析・評価内容のPDF形式でのダウンロード - プロファイルデータへ、HTTP APIを介したシステム間での直接的なアクセス(読み取り専用) - 最後にAPIデータを取得した日時がシステムに記録される。 - ユーザーアカウント - ユーザーアカウントはパスワードで保護されている。 - パスワードのリマインダーとリセットはウェブサイト上で行われる。 - データの完全性 - アップロードされた音声ファイルが破損している場合は、再アップロードを促すメッセージが表示される。 - データの分析 - ユーザーがアップロードした音声ファイルの以下の特徴は、AIと人間の分析者によって分析される。 - 声のトーン - 話すスピード - 声の大きさ - 発言に要する時間 - フィラーワード(つなぎ言葉)の使用 - 議論における発言の割合 - 適切な単語の選択 - AIと人間の評価者は、将来的に開発される基準に基づいて、各ユーザーのパフォーマンスを点数化する。 - AIと人間の評価者は、ユーザーのスコアやパフォーマンスに基づいて、フィードバックやアドバイスを行います。 - 管理パネル - 管理者は、ユーザーアカウントの作成、編集、無効化を行うことができる。 - 管理者は、チームにチーム共有フォルダの作成を許可する。 - システムセキュリティ - 一般ユーザーはユーザーデータにアクセスできない。 - APIは読み取り専用のデータアクセスを提供する。 - スパム送信者に収集されることを避けるために、電子メールアドレスを一般に公開しないようにすることが検討されている。 - 音声データは、アップロードしたユーザーのみが利用できる。 ### 3.2 影響のまとめ #### 3.2.1 KiKIサービスの組織への影響 KiKI サービスには、開発者とテスターの初期チームが必要となる。このプロジェクトでは、管理、プロジェクト管理、トレーニングなどの業務が必要となる。 このサービスの継続的なニーズをサポートする上で、KiKIにはシステムの信頼性と完全性を継続的に確保するため、システムとユーザーのデータを監督・管理する監視委員会が必要となる。 #### 3.2.2 KiKIサービスの運用面での影響 今後、AIの機能が充実により、他人の会話能力の評価結果を必要としている人に対して時間の節約につながることが期待されている。 利用者は、ウェブを介してリアルタイムにシステムとやりとりすることになるが、システムにデータをアップロードするためには、安全で信頼性の高いインターネット接続環境を確保する必要がある。すべてのユーザー情報、案内、及びFAQは、サービスの開発者によって提供され、KiKIサービスのWebページで管理される。 #### 3.2.3 KiKIサービスの社会的影響 KiKIの評価結果である「協調能力偏差値」は、現在国内で使用されている「学力偏差値(偏差値システム)」と組み合わせることで、より完全な能力評価を行うことができるようになる。 ## 4.0 性能要件 ### 4.1 具体的な性能要件 #### 4.1.1 正確さと妥当性 本システムでは、以下のような数多くのデータ品質保証技術を採用しているが、これらに限定されるものではない。 - データの完全性に関する要求事項の記録する。 - 2 人以上の参加者がいる場合、各参加者のサンプル音声データを記録する。 - 会話のテーマ/トピックの基本情報の記録する。 #### 4.1.2 タイミングとキャパシティ 本システムは、24時間365日オンラインで利用できることを想定している。しかし、必要に応じて予定され、事前に通知されたシステムメンテナンスによるダウンタイムは除く。 データは、AIおよび人間の評価者による評価のためにqueteに保留された後、使用可能となる。 開発チームは、タイムリーな応答時間とソフトウェア全体の機能性のために、システムリソースが適切であることを確認する。 サービスプロバイダーは、ISP/ホスティングプロバイダーのオプションを検討し、初期開発が完了したら、以下を含む。(ただし、これに限定されない)さまざまなデバイスでテストを行う。 - PC(Windows, OsX, Linux) - スマートフォンおよびタブレット(Android, ios) #### 4.1.3 障害の発生状況 このシステムはノンクリティカルである。一時的にアクセスできなくなっても、数日間であればユーザーに大きな負担をかけることはない。システムのホストサイトは、データのバックアップ機能とプロトコルを含むように選択される。選ばれた当事者は、毎日のバックアッププロトコルを備えた安全なネットワーク上にコードのコピーを維持する。IPS/ホスティング・プロバイダーを利用することで、ダウンタイムは最小限に抑えられるか、あるいは存在しないことが期待される。 ## 5.0 その他のシステム要件 ### 5.1 システムの説明 提案されているKiKIサービスは、ウェブベースの集中型データベースで構成され、すべてのユーザーのデータが保存される。一般的には、すべてのユーザーがシステムに直接入力し、システムから直接出力(レポート)を生成する。しかし、成長性を確保するためには、入力モードと出力モードの両方に柔軟性が求められる。 参加しているテスターは、入力(例:会議や会話の音声ファイル)を提供し、サービスプロバイダーは、システム管理とレポート作成のサポートを提供する。 ### 5.2 システムインテグレーション また、KiKIサービスの機能として、動画ファイルの受信と解析も可能にしたいと考えている。 ### 5.3 カスタマイズと柔軟性 顧客やユーザーがシステムを継続的に更新し、改良していくことが望まれている。 ### 5.4 持続可能性とオープンソース計画 このシステムは、希望する当事者のリーダーシップのもと、業界標準のウェブ開発ツールと手法を用いて開発される。 開発当事者は、いつでも保守責任の移転を求めることができるものとする。KiKIサービスを利用する当事者は、少なくとも1年に1回、システムの動作状況や、責任の移行や変更が必要かどうかのレビューを行うものとする。開発チームは、その判断により、またはサービスを利用する当事者が適切な報酬と引き換えに契約した場合には、この約束を超えて追加のサポートや開発サービスを提供することができるものとする。 ソースコードは、GitHub またはその他の相互に合意したリポジトリに保存される。 ### 5.5 システムドキュメント 開発者が提供するエンドユーザーガイドの必要性が予想される。開発者は、必要に応じて、または技術的な要求のためにサービスを使用する当事者から要求された文書(APIの文書を含むが、必ずしもこれに限定されない)を提供する。 ### 5.6 コードおよびデータの権利/データの所有権 一次開発当事者は、ソースコードを含むソフトウェア製品のすべての権利および所有権を保持するものとし、これには製品(データは含まない)を第三者にライセンスする権利も含まれるものとする。開発当事者は、本サービスを利用する当事者に対し、利用当事者およびその代理人が自己の目的のためにソフトウェア製品を使用するための、ソフトウェア製品およびその派生物に関するサブライセンス権を伴わない永久的、世界的、ロイヤリティフリー、非独占的、譲渡不能なライセンスを付与する。これには、必要に応じてソフトウェアを維持、改良、およびテストするために許可される無制限のバックアップ、開発、およびテスト用のコピーが含まれるが、本番用インスタンスは常に1つ以下とする。 本サービスを利用する当事者は、そのデータに関するすべての権利および所有権を保持するものとする。第一次開発当事者は、サービス利用当事者によるソフトウェア製品のインストールを維持、改善、サポートする目的に限り、データに対する無期限のロイヤルティフリー・ライセンスを受けるものとする。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up