# 卒研ノート # 2022/06/14 ## 研究テーマ:英語学習支援システム 英語に限らず、外国語を学ぶのには、単語をどう使うか又は学んだ単語自体を思い出すことが難しいと考える。英語学習を支援するために、ある文章から穴埋め問題を生成して、穴埋め問題を繰り返し解くことで英単語を思い出すのに役に立つと考える。 ## 研究問題 しかし、一つの穴埋めに対して、省略した単語だけが使えるとは限らない。そこで、**省略した単語以外の可能な単語をコンピュータで推定すること**について研究する。複数可能な英単語をユーザにフィードバックすることで、より英語学習に役に立つと考える。 **疑問点:** 推定する方法は?評価はどうする?先行研究については? ## 現在の研究問題における解決方法 単語を推定する方法に関しては2つ考えられる。 - 1つ目の方法は省略した単語を用いて同義語で推定するのが考えらる。問題点としては、同義語をどうやって調べるのかということ。同義語の辞書を用意することが可能が、手間がかかる。できればコンピュータに任せたいということ。 - 2つ目の方法は学習済みの言語モデルを使って単語を推定する。問題点として、推定した単語はすべての単語が実際に使えるわけではない。言語モデルで推定した単語の中で使えない単語をどうやって削除するのが問題。 **先行研究のキーワード:** 単語の意味論の類似性が多い # 2022/06/16 ## WordNet WordNetとは、単語間の意味的な関係を表す語彙データベースである。WordNetは、単語を同義語、異義語、異母語などの意味的関係に結びつけている。 **関係のある先行研究:** [English WordNet 2019 – An Open-Source WordNet for English - ACL Anthology](https://www.notion.so/English-WordNet-2019-An-Open-Source-WordNet-for-English-ACL-Anthology-69d117113f954ccba0788932cad68234) ## WordNetと研究問題の解決方法の関係 **現在の研究問題における解決方法** 単語を推定する方法に関しては2つ考えられる。 - 1つ目の方法 - WordNetを用いて穴埋め問題解答の単語に対する類義語を調べることができる。 - 2つ目の方法 - WordNetを用いて、言語モデルで推定する結果と穴埋め問題の解答のsynsetを調べて、その2つのsynsetsを比較して、ある類似度のパラメータを設定して、synsetsの類似度を比較した結果が設定したパラメータを満たしていれば、言語モデルの推定結果を通す、満たさなければ、削除する。 - **問題:** WordNetでは、1つの単語に対して複数のsynsetを持つ。synsetの類似度を比較するには、2つのsynsetの間のみ。 ## WordNet and Word2vec Word2vecはWordNetよりも幅広い類似性を表す。例えば、熱いと寒いの場合、2つとも温度を表すというような類似性を持つ。しかし、熱いと寒いは高い温度と低い温度の反対なものを表す。