クラスタ分析の手順

tags: `multivariate-causal-analysis-2023`

クラスタ分析は4種類ある。

階層クラスタリング
非階層クラスタリング(k-meansアルゴリズム)
非階層クラスタリング(正規混合分布, 潜在プロファイル分析とも)
非階層クラスタリング(潜在クラス分析)

外れ値を気にするのは、最初であったり、クラスタ分析しながらであったり、最後であったりする。

階層クラスタリングは、閾値を上下させて、クラスタ数を見極める。
非階層クラスタリングは、クラスタ数・クラス数を1つずつ増やし、情報量基準が最小になるところを見極める。最小でなく、エルボー法(減少幅が小さくなったところで止める)を用いることもある。