Try   HackMD

クラスタ分析の手順

tags: multivariate-causal-analysis-2023
すべて連続尺度
数十
百以上
名義尺度か順序尺度
エラー
エラー
問題なし
問題なし
ちょうどいい
最小
最小
最小
最小
最小
まだ足りない
減少中
減少中
減少中
減少中
減少中
クラスタ分析開始
変数型の確認
N数
階層クラスタリング
非階層クラスタリング
最小距離
最大距離
重心距離
Ward法
k-means法
正規混合分布
潜在クラス分析
パラメータ多過ぎ
CIC
AIC
BIC
AIC
BIC
水準数を減らす
変数を減らす
各クラスタの平均を推定
クラスタ分析完了
各クラスタの平均を推定
各クラスタの標準偏差を推定
各サンプルをクラスタに分類
各クラスのプロファイルを推定
各サンプルの所属確率を推定
各サンプルをクラスに分類
閾値を下げる
クラス数を1増やす
クラスタ・クラスごとの分析

クラスタ分析は4種類ある。

  1. 階層クラスタリング
  2. 非階層クラスタリング(k-meansアルゴリズム)
  3. 非階層クラスタリング(正規混合分布, 潜在プロファイル分析とも)
  4. 非階層クラスタリング(潜在クラス分析)

外れ値を気にするのは、最初であったり、クラスタ分析しながらであったり、最後であったりする。

  • 階層クラスタリングは、閾値を上下させて、クラスタ数を見極める。
  • 非階層クラスタリングは、クラスタ数・クラス数を1つずつ増やし、情報量基準が最小になるところを見極める。最小でなく、エルボー法(減少幅が小さくなったところで止める)を用いることもある。