我的心路歷程
數據分析學習筆記
Try
HackMD
我的心路歷程
·
Follow
Last edited by
戴偉璿
on
Mar 23, 2025
Linked with GitHub
Contributed by
0
Comments
Feedback
Log in to edit or delete your comments and be notified of replies.
Sign up
Already have an account? Log in
There is no comment
Select some text and then click Comment, or simply add a comment to this page from below to start a discussion.
Discard
Send
數據分析學習筆記
一維數據分析
算術平均數
假設
n
個數字
x
1
,
x
2
,
x
3
,
.
.
.
,
x
n
算術平均數
μ
=
1
n
(
x
1
+
x
2
+
x
3
+
.
.
.
+
x
n
)
加權平均數
假設
n
個數字
x
1
,
x
2
,
x
3
,
.
.
.
,
x
n
,其中
x
i
對應到的加權為
w
i
加權平均數
W
=
x
1
w
1
+
x
2
w
2
+
.
.
.
+
x
n
w
n
w
1
+
w
2
+
.
.
.
+
w
n
幾何平均數
假設
n
個數字
x
1
,
x
2
,
x
3
,
.
.
.
,
x
n
幾何平均數
G
=
x
1
×
x
2
×
x
3
×
.
.
.
×
x
n
n
應用:假設某物
n
年的成長率分別為
r
1
,
r
2
,
r
3
,
.
.
.
r
n
,其平均成長率
x
=
(
1
+
r
1
)
×
(
1
+
r
2
)
×
(
1
+
r
3
)
×
.
.
.
×
(
1
+
r
n
)
n
−
1
證明:假設平均成長率為
x
,過了
n
年後,其總成長率為
(
1
+
x
)
n
=
(
1
+
r
1
)
(
1
+
r
2
)
(
1
+
r
3
)
(
1
+
r
4
)
經過化簡可得
x
=
(
1
+
r
1
)
×
(
1
+
r
2
)
×
(
1
+
r
3
)
×
.
.
.
×
(
1
+
r
n
)
n
−
1
百分位數
第
m
百分位數
P
m
(
1
≤
m
≤
99
)
:至少有
m
%
的數據
≤
P
m
,至少有
(
100
−
m
)
%
的數據
≥
P
m
,
假設一筆升冪排序過後的資料有
n
個數據
x
1
~
x
n
I
=
n
×
m
100
I
∉
N
,
P
m
=
x
⌈
I
⌉
(
為
⌈
I
⌉
為
>
I
之最小整數)
I
∈
N
,
P
m
=
a
v
e
(
x
I
,
x
I
+
1
)
數據的離散程度
設
n
個數據
x
1
,
x
2
,
.
.
.
,
x
n
,其算術平均數為
μ
全距:一堆數據中,最大值與最小值的差
離均差:
x
i
之離均差為
x
i
−
μ
,
∑
i
=
1
n
(
x
i
−
μ
)
=
0
變異數
σ
2
=
a
v
e
(
∑
i
=
1
n
(
x
i
−
μ
)
)
標準差
σ
:
離均差平方的平均之平方根(
好饒舌
)
數據的伸縮與平移
給定
n
個數據
x
1
,
x
2
,
x
3
.
.
.
,
x
n
,其算術平均數為
μ
,標準差
σ
若
y
i
=
a
x
i
+
b
,
則
μ
y
=
a
μ
x
+
b
,
σ
y
=
|
a
|
σ
x
標準化數據
將數據標準化後可得Z分數或是標準分數,可看出比原平均多/少幾個標準差
Z
i
=
x
i
−
μ
σ
Z分數之特性
1.
μ
z
=
0
2.
σ
z
=
1
二維數據分析
用以觀察兩種數據之間的關係
i
.
e
.
睡眠時數與罹患慢性病的比例
相關係數
設有
n
筆資料
(
x
1
,
x
2
)
,
(
x
2
,
y
2
)
,
.
.
.
,
(
x
n
,
y
n
)
x
′
,
y
′
代表經標準化後的數據
相關係數
r
=
∑
i
=
1
n
x
i
′
y
i
′
n
若數據未經標準化,則相關係數
r
=
∑
i
=
1
n
(
x
i
−
x
―
)
(
y
i
−
y
―
)
∑
i
=
1
n
(
x
i
−
x
―
)
2
∑
i
=
1
n
(
y
i
−
y
―
)
2
迴歸直線
最小平方法:尋找最小的殘差平方和
迴歸直線方程式
標準化數據:
y
′
=
r
x
′
,
r
:
相關係數
未經標準化:
y
−
y
―
=
m
(
x
−
x
―
)
m
=
r
⋅
σ
y
σ
x
迴歸直線必過點
(
μ
x
,
μ
y
)
=
(
x
―
,
y
―
)
迴歸直線公式整理
設
S
x
y
=
∑
i
=
1
n
(
x
i
−
μ
x
)
(
y
i
−
μ
y
)
,
S
x
x
=
∑
i
=
1
n
(
x
i
−
μ
x
)
2
y
′
=
r
x
′
y
−
y
―
=
r
⋅
σ
y
σ
x
(
x
−
x
―
)
y
−
y
―
=
S
x
y
S
x
x
(
x
−
x
―
)
數據分析學習筆記
一維數據分析
算術平均數
加權平均數
幾何平均數
百分位數
數據的離散程度
數據的伸縮與平移
標準化數據
二維數據分析
相關係數
迴歸直線
迴歸直線公式整理
Expand all
Back to top
Go to bottom
數據分析學習筆記
一維數據分析
算術平均數
加權平均數
幾何平均數
百分位數
數據的離散程度
數據的伸縮與平移
標準化數據
二維數據分析
相關係數
迴歸直線
迴歸直線公式整理
Expand all
Back to top
Go to bottom
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up
Comment