# 第十一回報告会用(7/12発表分) # 進捗まとめ(7/12発表分) ## 全体の達成目標とその見積もりの工数 会話の種別を取得する。 - 自然言語処理に関する調査 - エージェントの方向性の決定 - GiNZAのインストール - GiNZAのチュートリアル - 会話種別の精査に必要なプログラムの考案 - 会話種別の精査に必要なcsvの仕様の考案 - 会話種別の精査に必要なプログラムの作成 - 会話種別の精査の実行テスト - 納品 ## 今回の達成目標とその見積もりの工数 会話種別の精査に必要なプログラムの作成 ## 進捗状況の説明 ### 会話種別の精査に必要なプログラムの作成 #### 独り言の発言を判定 スクレイピングで抽出したデータの吹き出しの種類の雲マークの発言を独り言として判定 #### プログラムの結合 今までに作成した、モジュールを結合、 フローチャートの通りに動くように調整。 #### 完成したプログラムの評価 テストデータを出力、問題点の洗い出しを行った。 4人の体感の正答率は平均して、70%前後といったところだった。 問題点を下記に記す。 ##### 問題点 記号が入力されたとき、問題のある出力がある。 メンションが、その人に対する発言として判定されない。 読点「、」の連続を文章として判定してしまう。 人間として判定できるもの、できないものがある。 「(人名)お姉ちゃ〜ん」は判定しない。 ##### 改善予定のもの 読点「、」の連続を文章として判定してしまう。 記号が入力されたとき、問題のある出力がある。 メンションが、その人に対する発言として判定されない。 ## 進捗状況に対する評価 初期に作成したフローチャートの機能の完成 ## 達成目標と作ったものの違い なし ## メンバーごとの仕事の内訳 筒井:独り言の判定するプログラムの作成 加藤:プレゼン資料作成、進捗状況報告 石元:発言の対象者を割り出すプログラムの精度調査 荒井:進捗管理、プレゼン資料整理、プログラムの結合 いつも通り、25万ずつ ## 残っている課題、解決策、今後の予定 プログラムの改善 ## 会話を判定するプログラムの評価 ### 荒井 体感80%の文字列は、正しく判定できているといえる 人名が入らない場合「、」で判定が区切られている可能性が高い village101 514行目,564行目,602行目 容疑者を列挙するときに 「人名、人名、人名、」 となったときに最初に出てくる人名を取得してしまうと言う問題 village101 611行目 レジーナが人名として判定されない village101 764行目,1062行目 かっことかは除外したほうがいいかも?<の前の文字列が名前として判定される (「・」,「、」,「>」,「>」) ### 石元 ざっくりと正解率をとった結果、約64%だった 問題点としては人名として判定されないのがあったり、()などが句読点として扱われるところだと思う ただ今回、発言ごとで正解率をとったので文章ごとで正解率をとった場合はもっと上がると思う ### 加藤 village103 高確率で正しく判断できていると思います 全体 ・人狼同士の会話(吹き出し赤枠)内でキャラ名ではなくハンネ?を使用している場合は判定されない ・名前でなく神父、村長などキャラ自体の役職やあだ名でメンションされることもある ・「〜じゃないよ?」などが質問判定される 78行目 「COしてしまった(?)ので〜」の(?)を質問と判定している 文章自体は全体発言でした 81行目 「〜だもん>ディーター」のように「>」をつけてメンションしている場合 個人への発言として判定されない 105行目 village101同様「人名、人名、人名」になった場合、最初の人への個人発言だと判定している 116行目 「(人名)お姉ちゃん」は判定する 「(人名)お姉ちゃ〜ん」は判定しない 118行目 「人名人名人名。」と人狼予想を挙げた場合の最後の人への個人発言として判定される 105行目と似た現象 142行目 「(人名)お疲れ、〜」のように人名の後に挨拶や言葉がついていると個人発言にならない 225行目 「ニコラス,パメラ,トーマス,ジムゾン,以上5人」という発言の判定が 「ニコラス、ニコラス、トーマス、トーマス」(それぞれ個人発言)になっている 227行目 「オットー(午後〜時)」のような、「この時間のこの人の発言」を示したいときの発言があると個人発言に判定される(括弧で区切っているから?) 254行目 プレイヤーが作った独自の名前(ペットの名前など)が個人発言の判定をされる 257行目、261行目 「にこらすさん…」 「ジムゾン〜、…」 個人発言として判定されていない 以降似たような感じで判定されたりされなかったりしています ### 筒井 13 ぶりっこみたいな発言 リーザ「リーザ、~なのです」がリーザがリーザに発言したようになっている remark_(自分)のケースは考えにくいからallにしてもいいかも こっからのはプログラム見てないから指摘しづらいけど 15 ~さんのところが特定されていない 22 「ボブ・・・」が[remark_ボブ,remark_ボブ,remark_ボブ]みたいになっている(多分全角のせい?) 68,117 remark_ぐ, remark_モー とは?