###### tags: `Data Science`,`Statistics` # 統計名詞 ## Z-Score > 原始分數與母體平均值的距離,並以標準差為單位 $\sigma != 0$ $$z = {x-\mu \over \sigma} = {原始數字 - 平均值 \over 標準差}$$ - 藉由從++單一(原始)分數++ ==減去== ++母體的平均值++,再依照母體(母集合)的標準差分割成不同的差距,按照z值公式,各個樣本在經過轉換後,通常在正、負五到六之間不等。 ### **變異數(Variance)** > 即量測所有 ++資料++ 到 ++平均數++ 的平均距離。 - 當平均值、中位數、眾數都相同的兩個數列,可能相當稀疏,故須使用變異數觀察其離散程度。 (54,56,64,64,82)與(63,64,64,64,65)兩組數據,雖然有相同的平均數、中位數及眾數;但兩組的變異數及標準差卻不同。 - 算法: 將各個誤差之平方(而非取絕對值,使之肯定為正數),相加之後再除以總數 **標準差(Standard Deviation)** # 機率論 Probability ## 最大似然估計 Maximum Likelihood estimation [剖析深度學習 (3):MLE、MAP差在哪?談機器學習裡的兩大統計觀點](https://www.ycc.idv.tw/deep-dl_3.html) ## 條件機率 conditional probability ## 貝葉斯法則 Bayesian theorem ## 隨機變量 random variable ## 二項式分布 ## 聯合機率分布 ## 條件機率分布 ## 貝葉斯決策理論 ## 期望和方差 # 訊息論 ## 熵 ## 聯合熵和條件熵 ## 戶信息 ## 相對熵 ## 交叉熵 ## 困惑度 ## 噪聲信到模型 ## SVM ### 線性可分 ### 線性不可分 ### 構造核函數