# 3/29までの進捗報告 ## 一般的な論文誌の論文を読んでみる - [ ] 情報処理学会 - [ ] 電子情報通信学会 - [ ] 人工知能学会 - [ ] ソフトウェア科学会 情報処理学会と人口知能学会の論文誌を調べてみる。 人口知能学会の過去5年分の論文を見てみる。 ## 論文の紹介 ### [Web上のレビューを利用した映画推薦システム](https://www.jstage.jst.go.jp/article/tjsai/30/1/30_30_102/_article/-char/ja) 映画をレビュー中の評価表現とその評価対象に基づき、ユーザーが書いた映画レビューから他者が書いた映画レビューを推薦する手法を提案する。本文では以下を仮定する。 仮定1  ユーザーが書いたレビューで肯定的に評価されている語はユーザーの嗜好を表す。肯定的評価されている他者のレビューを読んだときユーザーはそのレビューが示す映画に対して興味を喚起させられる。 仮定2  ユーザーが書いたレビューで否定的に評価されている語はユーザーの嗜好を表す。否定的評価されている他者のレビューを読んだときユーザーはそのレビューが示す映画に対して興味を喚起させられる。 従来手法としてはTF-IDFが用いられていたが、「この音楽はいい」という文と「この音楽はよくない」といった、反対の評価を表す文でも、同一の特徴語である「音楽」を含むことから類似していると判定してしまう。 ユーザーの嗜好に適した推薦を行なうためには、レビュー中の肯定的または否定的な表現とその評価対象に着目する必要がある。そこで、新たな推薦手法を提案する。 従来手法(TF-IDF)ではまず、入力文章および各推薦候補文章を語の重要度を要素とするキーワードベクトルで表現をする。そして、入力文書と各推薦候補文書のキーワードベクトル間の類似性を評価することで入力文書に類似した文書をDB中から発見し、これらを推薦文章として提示する。 提案手法1 従来手法における入力文章、推薦候補文章に対するキーワードベクトルの代わりにポジティブキーワードベクトルを用いる。入力文章において肯定的に評価されている語は肯定興味語と呼ぶ。肯定興味語のみをその文章における徳行語とみなし、重要度としてTE-IDE地を与える。一方で、肯定興味語ではない語は重要ではないと判断し、重要度を0にする。 提案手法2 従来手法における入力文章、推薦候補文章に対するキーワードベクトルの代わりにネガティブキーワードベクトルを用いる。入力文章において否定的に評価されている語は否定興味語と呼ぶ。否定興味語のみをその文章における徳行語とみなし、重要度としてTE-IDE地を与える。一方で、肯定興味語ではない語は重要ではないと判断し、重要度を0にする 肯定興味語と否定興味語の抽出方法について、これらは既存の手法である、鈴木らの手法を用いる。興味ごと評価表現との係り受け関係を利用して抽出する。鈴木らは、興味語を名詞に限定して抽出している。 評価実験1について 推薦手法1,2の有効性を評価するために2種類の実験を行った。 評価実験1 TF-IDFとランダムにレビューを取り出す手法、推薦手法の評価を行う。 被験者10人に過去に見たことのある映画に関するレビューを1から4件書いてもらい、書いてもらったレビューに対し、推薦手法ごとに推薦レビューを10件ずつ出力し、被験者に提示した。この時どの手法により推薦されたレビューなのかは、わからないように提示した。被験者はレビューを読み、推薦レビュー中の映画をどの程度みたいのかをアンケートで回答してもらった。アンケートではユーザーが見たことのない映画のレビューに関する評価を得るために、以下の予備質問に答えてもらった。 予備質問 推薦レビュー中の映画を見たことがありますか? 質問 推薦レビューを読んでその映画を見たいと思いましたか? 1. 非常に見たい 2. 見たい 3. どちらともいえない 4. 見たくない 5. 非常に見たくない 結果と考察 結果としては ![](https://i.imgur.com/pSSsSsV.png) 推薦手法1,2はランダム法と比べて高い精度で推薦できているといえる。一方で従来手法と比較すると、必ずしも提案手法が従来手法に比べ高い精度で推薦できているとは言えない結果であった。Welchのt検定行った結果も従来手法よりも優位に従来手法の精度よりも優位に大きいとは言えないということが判明した。 この後に重複されたレビューの重複を調査した。 ![](https://i.imgur.com/5nEMRJC.png) かぶりが少ないという結果が出ている。 本来は高い評価を得られるレビューだが、従来手法では推薦されないレビューを推薦手法をもちいることで、推薦することができるといえる。単純に推薦制度のみを評価するとこれらの手法には顕著な差異がないが、推薦手法1,2および従来の手法では推薦されるレビューが異なるため、相補的な関係があり、組み合わせることにより、様々な観点からの推薦をすることが期待できる。 評価実験2について 仮定1,仮定2が妥当であったのかを検証することを目的とする。同じ被験者に質問に回答してもらった。 質問 推薦レビューのどの文を読んで質問Aの回答に至りましたか?該当する文に線を引いてください。 質問Bでは、ユーザーに1文単位で線を引いてもらった。線を引いてもらった文はユーザーにその映画に関する興味を喚起させた文といえる。ここで、家庭の妥当性を検証するために以下の条件をみたす文について考える。 C1 ユーザーが書いたレビュー中の肯定興味語が、推薦レビュー中の文でも肯定興味語として含まれている。 C2 ユーザーが書いたレビュー中の肯定興味語が、推薦レビュー中の文に含まれている。 C3 ユーザーが書いたレビュー中の否定興味語が、推薦レビュー中の文で肯定興味語として含まれている。 C4 ユーザーが書いたレビュー中の否定興味語が、推薦レビュー中の文に含まれている。 C5 肯定的な評価表現が推薦レビュー中の文に含まれる。 仮定1の妥当性を検証するために、条件C1をみたす文がユーザーの興味を喚起させるのかを調査する。質問Aで非常に見たい、見たいを回答されたレビュー中の文であり、かつ条件C1をみたす文がユーザーの興味を喚起させる割合を調査する。比較対象をC2、C5とする。 仮定2の妥当性を検証するためにC3をみたす文が興味を喚起させるのかを調査する。比較対象として、C4とC5をみたす文とする。 結果と考察 ![](https://i.imgur.com/c9IBkaP.png) C1をみたす文が興味を喚起させる割合がC2、C5をみたす文が興味を喚起させる割合より有意に大きいといえる。よって、仮定1に基づく推薦の妥当性は高いといえる。 C3をみたす文はWelthのt検定では有効水準5%ではC5よりは高いが、C4をみたす文が興味を喚起させる割合より有意に大きいとは言えないという結果が得られた。有効水準10%では妥当性が高いといえる。これらの過程から、仮定2に基づく推薦の妥当性は高いといえる。 提案手法3と評価手法3について ユーザーが書いたレビュー中から抽出したユーザーの嗜好を用いて推薦レビューを決定するという点で共通しているため。 仮定1と仮定2のOR条件でベクトルを作成する。 仮定1と仮定2の双方の推薦結果を含むことが期待される。評価実験3では推薦手法3と推薦手法1,2により推薦されるレビューの重複を調べる。結果としては83%が推薦手法1と推薦手法2と同じ結果であることがわかった。 評価実験4 推薦手法3の推薦精度について。 ランダム法と、従来の方法において比較をする。ランダム法においては肯定的な観点を含むレビューに限定する。入力データをしては評価実験1とは別の10名が書いた30件のレビューを用いた。他は評価実験1と同じように実験を進めた。 結果 ランダム法よりも推薦制度は優位に大きいとはいえるが、従来の手法よりは優位に大きいとは言えないになという結果になった。しかし、推薦手法3、従来手法の間には重複が300件中46件のみであった。推薦手法3、従来手法、ランダム法に関しては嗜好の共通性、キーワードの共通性、ランダム性といった互いに異なる観点に基づいた推薦が、同程度の推薦制度で可能なことを示している。 本論文で提案した推薦手法は映画のレビューだけでなく、製品、観光地、レストラン、病院などのレビューにも適応可能である。様々なジャンルの推薦システムを同様のしくみで実現でき発展性がある。 ## 今後について 今後は論文を調べながらそろそろ分野を絞っていきたいと思う。 問題発見力 共感を持てるようなテーマ、対象を見つける。 身近な対象とか 手法より、なぜそれをやるのかを重視したほうがいいかも 研究として取り組む必要性 読んでみる論文 * お土産推薦 * イベント推薦 テーマ * コロナ関連 * Stay home * ふるさと納税 * お取り寄せグルメ * 選挙推薦 * フードツーリズム