# 第五回報告会用(5/24~5/31) # 要検討項目(5/31発表) 会話の種別の取得(いい日本語が思いつかないので後で変更する可能性あり) 人狼エージェントを開発する上で重要になるbotがどういった発言をするのか を決める際に、重要になってくる。 プレイヤー個人ごとの発言は、 質問であるか?、 回答であるか?、 誰から誰に向けて喋っているのか?、 それとも独り言なのか?、 という種別を取得する。 というのが必要なので、その手法を考案する。 # 進捗まとめ(5/31発表分) ## 全体の達成目標とその見積もりの工数 - 人狼BBSについての情報収集 - Webページ上のclassの特定 - CSVの仕様の考案(4/26までの目標) - スクレイピングについての情報収集 - role以外のスクレイピングの実装 - role以外のスクレイピングの稼働テスト(5/3までの目標) - roleを取得するスクレイピングの実装(5/10までの目標) - 上記二つの結合 - 稼働テスト(5/17までの目標) - 納品(5/24までの目標) - 追加課題会話種別の取得 ## 今回の達成目標とその見積もりの工数 - 納品 - 会話種別の精査の調査 ## 進捗状況の説明 ### 納品 1GBのcsvデータを納品 納品完了 ### 会話種別の精査の調査 人狼をプレイする時に重要になってくるのは、占い師や、霊媒師などの重要な 役職の発言に対して、正しく応答できるかであると考えた。 そのため、人狼ゲームを作成する場合、会話ログの種別の精査の重要性は低いと考えた。 メンバーの学習状況を加味して自然言語処理をがっつり使うのは難しい。 ゲームの転換点 (例えば、占い師や霊媒師のカミングアウトや、占いした人の公表など)に対して、 人狼ゲームのbotが自然な返答をすることを目的とする。 機械学習ベースというよりは、 自然言語処理を用いて、ルールベースをしっかりしようっていうアプローチ ### 自然言語処理についての調査 GiNZA 自然言語処理のspaCy(英語に対応)の日本語版のライブラリ ベクトル化の解析や、形態素解析などの色々なことができる。 ベクトル解析 文書を多次元01のベクトルとして置き換えて、 そのベクトルによって、近しい文章を探す。 シソーラス 同義語・類義語をまとめ、語句間の上位・下位概念の関係を定義し、体系化した辞書のこと 猫の上位概念 動物 猫の回概念 シャム、ラグドール ## 進捗状況に対する評価 納品済み、各自調査を進めている。 来週は実際に手を動かすところまでやりたい ## 達成目標と作ったものの違い ## メンバーごとの仕事の内訳 筒井:自然言語処理に関する調査 加藤:プレゼン資料作成、進捗状況報告 石元:自然言語処理に関する調査 荒井:進捗管理、プレゼン資料整理、納品、自然言語処理に関する調査 要相談 ## 残っている課題、解決策、今後の予定 なし 追加課題の会話の種別の取得のテスト 疑問点 会話データを学習させるとき、人狼BBSのログは役に立つのか? 狂人の人狼がたり、単純に独り言など、