# JMRX # Python勉強会#4 <!-- Put the link to this slide here so people can follow --> slide: https://hackmd.io/@AvWKpQTARl-uwEhmOAb9vg/rku5glcgr#/ --- ## アンド・ディでは ## リサーチャー ## データエンジニア希望の方を ## 大募集中です --- ## 本日のテーマ - 自然言語処理 --- ## 自然言語処理とは - 自然言語を処理する - 自然言語には曖昧・省略があり、解析が少し難しい --- ## 基本的な用語 - コーパス:文書の集合 - 辞書:単語の集合 - 形態素:これ以上分解できない言語の最小単位=ほぼ単語 - 係り受け:修飾・非修飾 --- ## 色々ありますが。。。 - 形態素解析して、単語をカウントするのが第一歩 - 形態素解析ツール - Mecab - Chasen - [Python3からMeCabを使う - Qiita](https://qiita.com/taroc/items/b9afd914432da08dafc8) --- ## 形態素解析 ![](https://i.imgur.com/kbh9doD.png) --- ## 形態素解析のポイント - 辞書次第 - 新しい単語 - 7月クールのドラマタイトルなどは出ない --- # 意味ネットワーク分析 - 弊社事例のご紹介 --- # 調査概要 * 購入意向や好感度、ブランドイメージの変化に影響した要素を俯瞰する目的で実施 * 回収300サンプル前後 * 対象者条件(性別・年齢含む)は、商品に合わせて変動 --- # 質問の構成 * 視聴前→視聴後の態度変容 * ブランド好感度、購入意向、イメージ * CM要素の評価 * タレント好感度・ふさわしさ、キャッチコピーふさわしさ、音楽好感度 * CMについて記憶に残ったこととそこからの印象 * 記憶に残ったこと →その印象 の自由回答 * 4組まで記入…平均2組程度の回答 --- ![](https://i.imgur.com/jUxXMXg.jpg) --- ![](https://i.imgur.com/tNyb9vJ.jpg) --- ## 人手がかかるのでとても大変 - 自動化したい --- ## 構造化を目指したFA回答に基づく意味ネットワーク分析手法とその自動処理化 --- ## 意味を数値化する - W2V(Word2Vec)という便利なツール - 王-男+女=女王 - 単語の意味がベクトル化される --- ## 自分では無理 - 作成には大量の文書が必要でまあまあ難しい - しかし、学習済みのデータを公開している人がいる - 学術用途ではより精度の高いデータも公開されている - 朝日新聞MediaLab - ホットリンク(SNSデータを使っており強い) --- ## コーディング作業の自動化 - FA回答に出てきた単語について、類似した意味を持つ単語をよしなにクラスタリング - 大体似た意味を持つ単語を持つFA回答が分類できる --- ## クラスタリング - scikit-learn - さまざまな分類・回帰・クラスタリングアルゴリズムを備える機械学習ライブラリ - 今回はk平均法を利用して形態素をクラスタリングし、タグとして扱う --- - CRtest出力例 - Google スプレッドシート --- ## 次回からの進め方 - 技術勉強会に名称を変更したい - 希望テーマと発表希望者を募集しています。 - 個人的には Excel Javascript APIをテーマ? - [Excel JavaScript API を使用した基本的なプログラミングの概念 - Office Add-ins | Microsoft Docs](https://docs.microsoft.com/ja-jp/office/dev/add-ins/excel/excel-add-ins-core-concepts) --- ### ご清聴ありがとうございます。 :sheep: 株)アンド・ディ 佐藤哲也 tetsuyas@and-d.co.jp
{"metaMigratedAt":"2023-06-14T22:37:42.546Z","metaMigratedFrom":"YAML","title":"JMRX Python勉強会第4回","breaks":true,"description":"第4回資料","contributors":"[{\"id\":\"723fa836-7e72-4971-9ebe-7f601bec3309\",\"add\":8,\"del\":7},{\"id\":\"02f58aa5-04c0-465f-aec0-48663806fdbe\",\"add\":2467,\"del\":454}]"}
    544 views
   Owned this note