概念図

tags: quality-management

データの概念図

データの構造を整理して描くのが、データの概念図である。データを分析する際の、手描きの地図になる。

本来は、大きな模造紙かホワイトボードの上に、付箋紙を貼っていく。オンラインで行う場合は、パワーポイントやエクセルなどを用いるか、ホワイトボードアプリを用いると作成しやすい。

準備

データに含まれている変数のうち、目的変数と関係がありそうな変数を全て、四角い箱で囲んで並べる。

目的変数も並べる。







G



1

犯罪率



2

区画



3

産業



4





5

窒素酸化物



6

部屋数



7

築年



8

距離



9

高速道路



10





11

生徒/先生



12

低所得者



13

住宅価格



寄せる作業

関係がありそうな変数同士を、近くに寄せていく。
このとき、近そうな理由も付与していくといい。

目的変数は動かさない。







G



1

犯罪率



8

距離



1--8




12

低所得者



1--12




2

区画



4





2--4




6

部屋数



2--6




9

高速道路



2--9




3

産業



5

窒素酸化物



3--5




7

築年



6--7




10





11

生徒/先生



11--10




13

住宅価格



関連づける作業

関係がありそうな変数同士を、直線や曲線で結んでいく。
このとき、関係がありそうな理由も付与していくといい。

目的変数とは結ばない。







G



1

犯罪率



8

距離



1--8




12

低所得者



1--12




2

区画



6

部屋数



2--6




3

産業



5

窒素酸化物



3--5




4





7

築年



9

高速道路



10





11

生徒/先生



11--10




13

住宅価格



変数同士の関係の種類

相関:Aが増えればBも増え、Aが減ればBも減る。ただしAが原因でもBが原因でもない。







G



A

A



B

B



A--B




因果:Aが増えればBも増え、Aが減ればBも減る。Bの変化の原因はAである。Bの変化はAの増減の結果である。







G



A

A



B

B



A->B





グルーピングする作業

線で繋がった変数を一つのグループにする。
そのグループに名前をつける。

孤立した変数があれば、データにないけど考慮した方がいいグループを作っても良い。

このとき、ネーミングの理由も記録しておくといい。







G



1

犯罪率



F1




人口統計的条件



1--F1




F5




社会的条件



1--F5




2

区画



2--F5




3

産業



F3




地理的条件



3--F3




4





4--F3




5

窒素酸化物



F4




環境条件



5--F4




6

部屋数



F2




建物



6--F2




7

築年



7--F2




8

距離



8--F1




9

高速道路



9--F3




10





10--F5




11

生徒/先生



11--F5




12

低所得者



12--F1




13

住宅価格



目的変数とグループの関係を整理する

各グループと目的変数を線で結ぶ。孤立した変数があれば、直接に目的変数と結ぶか、データにないけど考慮した方がいいグループを作って、そこから結ぶ。

互いに関係がありそうなグループ同士も線で結ぶ。







G



1

犯罪率



F1




人口統計的条件



1--F1




F5




社会的条件



1--F5




2

区画



2--F5




3

産業



F3




地理的条件



3--F3




4





4--F3




5

窒素酸化物



F4




環境条件



5--F4




6

部屋数



F2




建物



6--F2




7

築年



7--F2




8

距離



8--F1




9

高速道路



9--F3




10





10--F5




11

生徒/先生



11--F5




12

低所得者



12--F1




13

住宅価格



F1--13




F1--F2




F1--F4




F2--13




F2--F3




F2--F5




F3--13




F3--F1




F3--F4




F4--13




F4--F5




F5--13




F5--F1




F5--F3




これが、私が教わったデータの概念図。

この後

データに足りない変数があれば、他のデータから持ってくる、合成して作る、などする。