Try   HackMD

機率與統計 - Ch3 : Random Variables and Probability Distributions

tags: statistics

前言 : 本章要搞懂的

  1. 隨機變數的定義 : mapping函數的概念。
  2. 離散、連續之下的函數性質 :
    • 離散 : 機率函數。
    • 連續 : 機率密度函數。
  3. 多變數函數的性質 :
    • 邊際分佈。

一 . 隨機變數

(一) . 隨機變數的基本概念

  1. 定義 : 是一個相sample point 映射到一個數值set的函數
    • sample point 是定義域;random variable 為值域 -
    • random variable常常視為事件。
  2. 例 : 值一枚硬幣,設隨機變數的關係為此二次正面的次數。
    • 多個sample point 可以指向同一個點 : 因為sample point是定義域。
    • 依照函數的離散定義 : 一個sample point不可以有多個random variable。
  3. 注意 : 是同一個隨機變數會可能代表多個樣本點,這個概念很重要。

(二) . 機率分布

  1. 離散型機率分佈 : 代表sample point 的數量是有限的
    • 良率、不良率。
  2. 連續型機率分佈 : 代表sample point 的數量是無限的
    • 身高、體重。

二 . 離散型機率分佈

(一) . 機率函數(Probability function)

  1. 定義 : 將隨機變數映射到機率值的函數。
    • random variable是定義域。
    • random variable代表的機率是值域。
  2. 例 : 以上例,可以將隨機變數對應到機率。
    • 投擲兩次硬幣,0次為正的機率為 : 1/4。
    • 投擲兩次硬幣,1次為正的機率為 : 1/2。
    • 投擲兩次硬幣,2次為正的機率為 : 1/4。
  3. 機率函數的性質 :
    • f(x)>=0
      : 代表每個事件的機率必大於1。
    • x=1xf(x)=1
      : 所有事件的總何必為1。
    • f(x)=P(x):
  4. 將實際發生的情況進行數值化 : 經由多次的mapping。
    • 原本樣本空間的每一個樣本點都是機率相等的。
    • 將樣本點映射到隨機變數,由隨機變數整合形成『事件』
    • 隨機變數的機率,可以視為一個『事件』的機率。

(二) . 機率累積函數

  1. 定義 : 我們定義
    F(X)=f(X>=x)
    • 其中 :
      F(x)
      為機率累加函數。
    • 其中 :
      f(x)
      為機率函數。
    • 可以知道機率累加函數即為隨機變數到某指的總和。
  2. 注意 : 因為分佈是離散的,所以,
    F(x)
    的值是到某個點才上升的。

三 . 連續型機率分佈

(一) . 機率密度函數(PDF)

  1. 定義 : 將隨機變數映射到機率密度的函數。
    • 機率密度 :
      =
    • random variable是定義域。
    • random variable代表的機率密度是值域。
  2. 例子 : 若一群人的身高分佈為下。
    • 連續下
      f(x)
      代表的意思 : 為機率密度,代表『相對』機率。
    • 離散下
      f(x)
      代表的意思 : 為機率值,代表『絕對』機率。

  1. 機率密度函數的性質 :
    • f(x)>=0,xR
    • f(x)dx=1
      : 代表機率密度『相對』的概念。
    • P(a<x<b)=abf(x)dx
    • P(a)=aaf(x)dx=0

(二) . 累積分佈函數

  1. 定義 :
    F(x)=P(X<=x)=xf(x)dx
    • 其中 :
      F(x)
      為累積分佈函數。
    • 其中 :
      f(x)
      為機率密度函數。
    • 可以知道累加分佈函數即為隨機變數到某指的機率密度總和。
  2. 和PDF的關係 : 由微積分基本定理可以知道
    • ddxF(x)=f(x)
    • f(x)dx=F(x)

四 . 多變數機率分佈

(一) . 多變數時的函數

  1. 隨機變數: 將兩個自變數的有序對
    x,y
    (代表的是x,y事件內的樣本點),映射到同一個隨機變數
    g(x,y)
  2. 機率函數、機率密度函數 : (基本上定義不變)
    • 機率函數 : 離散下,將隨機變數映射到機率的函數。
    • 機率密度函數 : 連續下,將隨機變數映射到機率密度的函數。
  3. 例 : 以離散型機率為例
    • 隨機變數 :
      g(x,y)
      可以視為
      z
      軸。
    • 機率函數 : 可以視為在
      xy
      平面的向量。

(二) . 離散型和連續的多機率分佈

  1. 離散型機率分佈的機率函數 :
    • 1>=f(x,y)>=0,(x,y)
    • xyf(x,y)=1
    • P(X=x,Y=y)=f(x,y)
  2. 連續型機率分佈的機率密度函數 :
    • f(x,y)>=0,(x,y)
      : 注意,
      f(x,y)
      可能>1,因為
      f(x,y)
      不是機率。
    • f(x,y)dxdy=1
    • P[(x,y)A]=Af(x,y)dxdy
  3. 注意 : 連續下的機率值為機率密度函數下的面積;而離散時則單個機率密度函數即為機率。(和單變量的定義一樣)

(三) . 邊際機率分佈

  1. 定義 : 在二變數的機率分布下,我們只固定觀察一個變量。
  2. 解釋 : 簡述與圖
    • 對一個離散型變數
      f(x,y)
      而言。
    • g(x)
      為x的邊際分佈,
      h(y)
      為y的邊際分佈。
    • 可以知道
      g(x)=f(x,y)
      的x為定數。
    • 可以知道
      h(y)=f(x,y)
      的y為定數。

  3. 公式 - 離散下 : 對雙變數分佈的
    f(x,y)
    • x
      的邊際分佈 :
      g(x)=yf(x,y)
    • y
      的邊際分佈 :
      h(y)=xf(x,y)
    • 例 : 對
      f(x,y)=1/4
      ;且
      0x1,0y1
      • g(1)=yf(1,y)=1/2
      • h(1)=xf(1,y)=1/2
  4. 公式 - 連續下 : 對雙變數分佈的
    f(x,y)
    • x
      的邊際分佈 :
      g(x)=f(x,y)dy
      ,此時積分的範圍為y的範圍。
    • y
      的邊際分佈 :
      h(x)=f(x,y)dx
      ,此時積分的範圍為x的範圍。