service-data-science-2023
研究の目的設定とデータ収集の計画とデータの取得と分析と考察と報告からなる研究フローを体験して、習得してもらう。クオリティマネジメントよりは少し複雑な、複数の手法を順序立てて活用するシナリオを分析に用いることで、一つの分析が複数の手法の組み合わせで構成し得ることを学ぶ。この科目もクオリティマネジメントと同様に、分析で迷子になりすぎないように配慮している。
前半に少し説明して、後半にグループワークを進めて貰います。
2週目にグループを編成します。
JMPと多変量解析に置いてある書籍は、参考までに表示のみで共有している。役に立つと感じた書籍は、各自で購入されたし。
その他、説明したこと。
こちらに日付別に置いていきます。
今後の流れを書いてみました。
以下のような形で進められると、ちょうど終わりそうです。
24日と7日がハードですが。。
17日 アンケート設計
アンケート①
24日 アンケート集計から主成分分析、主成分のネーミング、選好回帰、マッピング
31日 L8直交表の理解、プロファイルカード作成
アンケート②
7日 アンケート集計から、コンジョイント分析、部分効用値、注目度等の作成からの新しい○○の提案に結び付ける
可能であれば、アンケート③を取り、確認調査を行う。
新しい○○をしたいか、否かのようなyes/no Question。
14日 発表
データの分析にJMP Proというソフトウェアを利用する。このソフトウェアは、慶應義塾全体でサイトライセンスを契約している。皆さんは次の2ヶ所から入手できる。
インストーラとライセンスファイルをすぐにダウンロードできるので、湘南藤沢ITCを用いることを勧める。信濃町KICは、登録後にITCからのメールでの連絡を待つ必要がある。
JMPの基本的な使い方は、前期のクオリティマネジメントで少しずつ紹介した。
Excelをデータの管理に用いる。WordとPowerPointを含めて、Office 365を抄録やプレゼンテーション資料の作成に用いる。
TWatalu Yamamoto is inviting you to a scheduled Zoom meeting.
Topic: サービスデータサイエンス 2023
Time: Oct 3, 2023 04:30 PM Osaka, Sapporo, Tokyo
Every week on Tue, until Nov 14, 2023, 7 occurrence(s)
Oct 3, 2023 04:30 PM
Oct 10, 2023 04:30 PM
Oct 17, 2023 04:30 PM
Oct 24, 2023 04:30 PM
Oct 31, 2023 04:30 PM
Nov 7, 2023 04:30 PM
Nov 14, 2023 04:30 PM
Please download and import the following iCalendar (.ics) files to your calendar system.
Weekly: https://keio-univ.zoom.us/meeting/tZEud-CgqDwiHNwFzgBEUfN9fG7kQNM-KuDC/ics?icsToken=98tyKuGtrTsjEtKSuB-PRpwMA4igXfzwpmZHgo1KugXiIQVmZC2vMMUVOYNRPZX7
Join Zoom Meeting
https://keio-univ.zoom.us/j/85309867868?pwd=TzVoZnIvTkwzTnhzZHNIbjZZNGQzdz09
Meeting ID: 853 0986 7868
Passcode: 069701
https://join.slack.com/t/keio-health-ds-2022/shared_invite/zt-24majin6o-v6hdxl_CnfZGFNqP0OIK8A
これをクリックすると、https://keio-health-ds-2022.slack.com/ というSlackのワークスペースに自分で登録することが可能です。
この科目で使用するのは「サービスデータサイエンス2023」というチャンネルです。
Slackから招待します。ホワイトボード共有サービスです。
次回までのお願い:自習にグループ分けを行うので、抄録に目を通してくる。
主成分分析の目的
A. 次元縮約(機械学習:画像その他のパターン認識:データアナリティクス? 簡単な操作)
B. データアナリティクス的深く:元の変数から新しく評価指標を作成する(スコアリング)
C. 新しい指標のもとで、対象の分類(クラスタリング)、ポジショニング(可視化、2次分析)
D. 変数の分類、対象の分類はdualな構造
E. 機械学習的にも教師なしなので注目されている
以下のステップの作業をしてください。
そこで、下記の論文をよく読んでください。最初の課題の提示、そこで、主成分分析活用の目的、もとの変数の次元(数)、主成分の数など主成分分析の実証論文の記述の仕方がよくわかりますので。
この文献(経営パターン分析)の第4表(P21)が各主成分の意味を名称として確定するための因子負荷量(係数)を符号付きでみる表となります。この表を自身で選ばれた先行論文で作成し、どのような評価指標として解釈されているのかを記入してください。
本日の授業4:30~5:10までのワークです(オンデマンド)
本日26日7,8回目(12回中)の授業内容です。
最終授業11月9日は発表会とゲスト講師の講演となります。したがって発表会までの分析を終え、発表スライドを作成しておかなければなりません。
4時30分から、添付の先輩の発表スライド2つ、先ず見てください。
1)発表後、ファイザーでの発表を依頼されグループの方が仕上げたものです。スライド29まではサービスデータサイエンスの内容です。後半は多変量因果分析の内容なので、取り合えず現段階では、前半29枚目までをみてください。
みなさん、データは入手されましたでしょうか? 主成分分析はグループで主成分軸の解釈を議論し、最後の対象のポジショニングまでしないと自身の分析スキルとして身に着かないので、今日は、その点を確認いたします。
先週のコンジョイントの分析の解説動画をgacco動画のチャンネルにリンクしています。
最終発表会は11月9日です。
グループの演題(メインタイトル、サブタイトル、名前(専修名))を授業冒頭までにお知らせください。
特別講演2件とグループ発表3件(中間発表)で構成します。
最終発表会