quality-management
データの構造を整理して描くのが、データの概念図である。データを分析する際の、手描きの地図になる。
本来は、大きな模造紙かホワイトボードの上に、付箋紙を貼っていく。オンラインで行う場合は、パワーポイントやエクセルなどを用いるか、ホワイトボードアプリを用いると作成しやすい。
データに含まれている変数のうち、目的変数と関係がありそうな変数を全て、四角い箱で囲んで並べる。
目的変数も並べる。
関係がありそうな変数同士を、近くに寄せていく。
このとき、近そうな理由も付与していくといい。
目的変数は動かさない。
関係がありそうな変数同士を、直線や曲線で結んでいく。
このとき、関係がありそうな理由も付与していくといい。
目的変数とは結ばない。
相関:Aが増えればBも増え、Aが減ればBも減る。ただしAが原因でもBが原因でもない。
因果:Aが増えればBも増え、Aが減ればBも減る。Bの変化の原因はAである。Bの変化はAの増減の結果である。
線で繋がった変数を一つのグループにする。
そのグループに名前をつける。
孤立した変数があれば、データにないけど考慮した方がいいグループを作っても良い。
このとき、ネーミングの理由も記録しておくといい。
各グループと目的変数を線で結ぶ。孤立した変数があれば、直接に目的変数と結ぶか、データにないけど考慮した方がいいグループを作って、そこから結ぶ。
互いに関係がありそうなグループ同士も線で結ぶ。
これが、私が教わったデータの概念図。
データに足りない変数があれば、他のデータから持ってくる、合成して作る、などする。