# 統計学基礎 ## 分散、標準偏差、標準化指標 ![](https://i.imgur.com/DpxOEZP.png) 標準偏差で集団のばらつきを評価できるけど、次元が違うもの同士は比較できない だから標準偏差を平均で割って無次元化することで、単位の違う集団同士のばらつきを評価できるようにしたのが変動係数cv ## 相関係数 ![](https://i.imgur.com/9bKgXKu.png) ![](https://i.imgur.com/HIXflVO.png) ## 偏相関係数 ![](https://i.imgur.com/7BOr4I4.png) 例題 あるクラスの算数と国語と理科の点数について相関係数を調べると、 算数と国語の点数の相関係数は0.8051、 国語と理科の点数の相関係数は0.7930、 理科と算数の点数の相関係数は0.9883 でした。 理科の点数の影響を除いた算数と国語の点数の偏相関係数の値はいくつ? 答え:0.23 ただ単に算数と国語の偏相関係数は0.79とそこそこあったけど、理科の影響を除いたら0.23とかなり下がった。 「純粋な相関だけだと頭が良いやつが点数が高い」ってだけで、科目間の相関が見えづらかったけど 偏相関係数を使うとより科目間の相関が出しやすくなった? ## 回帰直線 ![](https://i.imgur.com/ZjwBDkQ.png) ![](https://i.imgur.com/5BYhaYp.png) ## 決定係数 ![](https://i.imgur.com/0hHLOlR.png) - この図でいうと、うまくデータがフィットすると赤色の棒が短くなり、水色が長くなる。 - Sy小、Sr大となって決定係数が大きくなり、回帰直線が良く当てはまっていることが分かる。(0<=R^2<=1)別名分散説明率という。 ## 時系列データについて ![](https://i.imgur.com/N7cG7gO.png) - 幾何平均は、ある基準点からの変化率の平均を見たいときに適している。 - いままでの算術平均が![](https://i.imgur.com/Zc38pj4.png) - 上に対して幾何平均は![](https://i.imgur.com/tdGGCNZ.png) 総和をnで割ってたのが、総積を1/T乗根を取るだけ rGを求めるには最後÷最初の1/T乗でOK ## 時系列データの変動分析と自己相関 ![](https://i.imgur.com/alkxdE5.png) C0はラグ0のときの共分散即ち![](https://i.imgur.com/AyphvgW.png) となるからyの分散のこと。 ## クロス集計表とオッズ比 ![](https://i.imgur.com/pmDZLq9.png) この例でいえば、例えば週間の有無が病気のなりやすさに無相関なら、全部の確率が50%と一様になって、オッズ比が0になるはず ## ベイズの定理 ![](https://i.imgur.com/Lfp0txJ.png) ## 確率変数と分布、期待値 ![](https://i.imgur.com/CmVWJEB.png) ![](https://i.imgur.com/pVtPqot.png) ## 確率変数のモーメント、歪度、尖度 ![](https://i.imgur.com/8by4pxt.png) ![](https://i.imgur.com/aUyUi7Y.png) ## 離散型確率分布 ![](https://i.imgur.com/YpIPEV4.png) ## 連続型確率分布 ![](https://i.imgur.com/s36z6fW.png) ![](https://i.imgur.com/CxI9Z9N.png) ![](https://i.imgur.com/GNnaKmU.png) ## 2つの確率変数の計算 ![](https://i.imgur.com/A6a3yPb.png) ## 標本平均の期待値と分散 ![](https://i.imgur.com/8d2FOfY.png) ## 標本分布 ![](https://i.imgur.com/VWKjM6M.png) ![](https://i.imgur.com/Kqx4lqN.png) ## 大数の法則と中心極限定理 ![](https://i.imgur.com/FAT0Dvz.png) ## 重回帰分析 ![](https://i.imgur.com/VzNq8DO.png)