2021SMath207 Week1

--- title: 2021SMath207 Week1 tags: 2021S, Math207 --- ---- ![](https://i.imgur.com/8QWlK0D.png) :arrow_up:掃這裡進入此頁面:arrow_up: ## 1: 關於這門課 (2020/09/06~2020/09/12) - [課程網頁](http://www.math.nsysu.edu.tw/~chlin/2021SMath207/2021SMath207.html)：課程資訊、大綱、評分方式、各種規範。 - [課程筆記](https://hackmd.io/@jlch3554/2021Math207-notes/)：這個頁面，記錄上課內容、作業。 - [網路大學](https://cu.nsysu.edu.tw/)：查分數、問問題，搶 AL 分數。 - 課本：[_Applied Combinatorics_](https://appliedcombinatorics.org/) by Mitchel T. Keller and William T. Trotter [ [html](https://rellek.net/book/app-comb.html) [pdf](https://www.rellek.net/book-2017/app-comb-2017.pdf) ] - [YouTube 影片清單](https://www.youtube.com/playlist?list=PLjjwN6s_CKYkKW_wqQFBNluqrUdWdvPMM) - Discord: `https://discord.com/invite/behbC9NmqNJ` **學習輔導角落** 110年3月22日至 110年6月18日止時間：每週二下午 6:00 ~ 8:00 地點：4011-2 --- ### 暖身一下瘋瘋和癲癲想玩賭骰子的遊戲： 1. 每次擲[兩顆六面骰](https://www.random.org/dice/)。 2. 如果點數一樣：瘋瘋得 2 分。 3. 如果點數差 1：瘋瘋得 1 分。 4. 如果點數差 2：沒人得分。 5. 如果點數差 3：癲癲得 1 分。 6. 如果點數差 4：癲癲得 2 分。 7. 如果點數差 5：癲癲得 3 分。找一個你身旁的同學，一個當瘋瘋、一個當癲癲。試試看誰得比較多分。 **要加簽的同學請到前面簽名** --- ### 課前準備 - Kahoot: [Get ready for 2021FMath207](https://create.kahoot.it/share/2021smath207-get-ready-for-the-course/00bf6600-914e-4fdd-b8f2-169c3fd0fda0) - HW0: [Tell me your email](https://docs.google.com/forms/d/e/1FAIpQLSfV2rEICW_hyPCWW6dU9W3Bg55zwLXWmLXNYwCZUzZ6XbPQtg/viewform) [//]: # ( warn up something about syllabus ) --- ### 這週要做的事 #### 影片（每週二上課前完成） - [video 1](https://www.youtube.com/watch?v=mTf2jPkFrrA&list=PLjjwN6s_CKYkKW_wqQFBNluqrUdWdvPMM&index=1): Topics in discrete mathematics (to be watched in class) - reading assignment: [Definition of Probability space](https://rellek.net/book/s_probability_intro.html#p-1278) to Example 10.2. - questions 1: 請到[網路大學](https://cu.nsysu.edu.tw/) > 1092_離散數學（二）> 作業評量區 > 測驗 / 考試。只能做答一次，限時 60 分鐘。（第一週在週五半夜 11:59 截止，往後在週二上課前 3:00 pm 截止） ``` AL 分數 += Question 分數 ``` [//]: # ( geometric distribution finite, doable get your hand dirty: try, example, observe, programming three categories how to read text book probability space ) #### HW1（下週二 5:00 pm 前交給助教）請註明姓名學號以及第幾次作業 1. 若某一硬幣丟到正面的機會為 $p$，其中 $0<p\leq 1$。令 $X$ 為**第一次**丟到正面的次數，則 $X$ 為一隨機變數。（$P(X=1)=p$, $P(X=2)=(1-p)p$, $P(X=3)=(1-p)^2p$, $\ldots$）求 $X$ 的期望值與變異數。 2. 假設你能修改[暖身一下](#%E6%9A%96%E8%BA%AB%E4%B8%80%E4%B8%8B)的遊戲規則，但你只能調整點數相差 5 的計分；要把分數調成多少才會是一個公平的遊戲（期望值為 0 ）？ --- ### 如何使用 SageMath [SageCell](https://sagecell.sagemath.org/) [Sage Basics](http://jephianlin.github.io/SageBasics.pdf) [Sage Cheatsheet](https://hackmd.io/@jlch3554/S16G7gv8I) [安裝指南](https://docs.google.com/document/d/1CXc1Aw8qA_jpN2mar-i7Ik3jB3fswXYkGp9ww4Rb_QU/edit) 丟一顆灌鉛的骰子 ```python import random space = [1,2,3,4,5,6] + [6]*5 random.choice(space) ``` - 丟一顆 20 面骰。 - 從 `['Alice', 'Bob', 'Charles']` 中抽一個人。 :bookmark: --- ### 瘋瘋癲癲的遊戲在[暖身一下](#%E6%9A%96%E8%BA%AB%E4%B8%80%E4%B8%8B)的遊戲中，可能的狀況有 36 種。把瘋瘋的分數計為正、癲癲的分數計為負，則為下表： | dice 1 \ dice 2 | 1 | 2 | 3 | 4 | 5 | 6 | | ---------------:| ---:| ---:| ---:| ---:| ---:| ---:| | 1 | 2 | 1 | 0 | -1 | -2 | -3 | | 2 | 1 | 2 | 1 | 0 | -1 | -2 | | 3 | 0 | 1 | 2 | 1 | 0 | -1 | | 4 | -1 | 0 | 1 | 2 | 1 | 0 | | 5 | -2 | -1 | 0 | 1 | 2 | 1 | | 6 | -3 | -2 | -1 | 0 | 1 | 2 | - 這 36 種**結果** $S=\{11,12,\ldots, 66\}$ 稱為**樣本空間** - 每一個結果發生的機率都一樣是 1/36，而一群結果組成**事件**（比如說 "點數差 1" 這個事件由 10 種結果組成） - **機率函數** 為 $P(E) = |E| / 36$；比如說 $P(\{11,22\}) = 2/36$，意思是丟到 11 **或** 22 的機率是 2/36 - 機率函數**必須**滿足 $P(\emptyset)=0$、$P(S)=1$、且 $P(A\cup B) = P(A) + P(B)$ if $A\cap B = \emptyset$。 :::success 試試看： 1. 把 36 個可能都寫出來，圈出 "dice 1 是 6" 的事件，並計算其機率。 2. 圈出 "點數和為 6" 的事件，並計算其機率。 3. 圈出 "一奇一偶" 的事件，並計算其機率。 ::: --- ### 隨機變數單一一場遊戲並沒有一定的結果，但卻也還是遵循一定的隨機法則。令 $X$ 為一場遊戲的得分，則 $X$ 可能為 $-3,-2,-1,0,1,2$，而各自有各自發生的機率。更精確來說： - $P(X=-3) = 2/36$ - $P(X=-2) = 4/36$ - $P(X=-1) = 6/36$ - $P(X=0) = 8/36$ - $P(X=1) = 10/36$ - $P(X=2) = 6/36$ :::warning 如果列出來的機率加在一起不是 1 :scream: 可以檢查一下： 1. 是否考慮了全部的可能性 2. 有沒有重覆算到 3. 機率是否算錯 ::: 這樣一個受到機率規範的變數稱作一個**隨機變數**，而它所受到的機率規範稱作一個**機率分布**。（比如說 $X$ 是骰子一的點數、$Y$ 是骰子二的數點，它們是不同的隨機變數，但遵循同樣的機率分布。）我們通常用長條圖表來表示一個機率分布。 ![](https://i.imgur.com/FGqQqb8.png) :::success 試試看：考慮以下的隨機變數，並把它的所有可能結果及機率描述出來。 1. $X$ 為擲一顆公正骰子的點數。 2. $X$ 為一次擲三枚公正硬幣出現的人頭數。 3. $X$ 為擲一顆公正骰子的頂部及底部點數和。 4. ~~$X$ 為你期末考的分數。~~ ::: --- ### 常見的機率分布 1. 離散型均勻分布 $\mathcal{U}(S)$：樣本空間 $S$ 為一些數字的集合，每個數字發生的機率一樣 2. 伯努力分布 $\mathcal{B}(p)$：擲一枚硬幣，正面為 1 反面為 0，正面的機率為 $p$ 3. 二項式分布 $\mathcal{B}(n,p)$：執行伯努力分布 $n$ 次所得的總和（正面的次數） 4. 幾何分布 $\mathcal{G}(p)$：執行伯努力分布一直到第一次正面所須的次數 :::success 試試看： 1. 若 $X$ 遵循 $\mathcal{B}(0.3)$，$P(X=0)=?$ 2. 若 $X$ 遵循 $\mathcal{B}(3,0.5)$，$P(X=0)=?$ 3. 若 $X$ 遵循 $\mathcal{G}(0.5)$，$P(X=2)=?$ ::: --- ### 期望值（機率分布的中心）一個機率分布的**期望值**就是利用其機率將可能的數值作加權平均： $$\mathbb{E}(X) = \sum_{x} P(X=x)\cdot x.$$ :::success 試試看： 1. 計算伯努力分布的期望值。 2. 計算二項式分布的期望值。 3. 計算幾何分布的期望值。 ::: --- ### 變異數（機率分布的寬度）一個機率分布的**變異數**就是各數值到期望值 $\mu = \mathbb{E}(X)$ 的差方取加權平均： $$\operatorname{Var}(X) = \mathbb{E}[(X - \mu)^2] = \sum_{x} P(X=x)\cdot (x - \mu)^2.$$ 所以要計算變異數要先把期望值 $\mu$ 先算出來。 ##### Proposition 10.23 變異數 = 方均 - 均方 $\operatorname{Var}(X) = \mathbb{E}(X^2) - \mu^2$ :::success 試試看： 1. 計算伯努力分布的變異數。 2. 計算二項式分布的變異數。 3. 計算幾何分布的變異數。 ::: :bookmark: --- ### 估計期望值對大部份自然界的隨機變數（比如說人的身高），我們只能拿得到**樣本**，而不會知道完整的機率分布。利用 [SageCell](https://sagecell.sagemath.org/) 執行以下程式碼，並猜測 $X$ 的期望值。 ```python import numpy as np x = 5 * np.random.rand(100) - 2.5 y = 2 * np.random.rand(100) - 1 out = (x**2 + y**2 <= 1).astype(int) print("100 samples of X:") print(out) print("The mean of these samples:") print("(sum of samples / 100)") print(out.mean()) ``` --- ### 估計變異數利用 [SageCell](https://sagecell.sagemath.org/) 執行以下程式碼，並猜測 $X$ 的變異數。 ```python import numpy as np s = np.random.randint(0,10,(100)) out = s % 2 * 10 print("100 samples of X:") print(out) print("The variance of these samples:") print("(sum of (samples - mu)^2 / 100)") print(out.std()**2) ``` :::spoiler 說明程式碼做的事情不外乎就是抽出 100 個 0 ~ 9 的數字如果是奇數則回傳 10 如果是偶數則回傳 0 因此 $P(X = 10) = 0.5$ 且 $P(X = 0) = 0.5$。總體的變異數應該是 $10\times 0.25 = 25$。然而程式執行出來的結果幾乎都是 24.? 很少會跳到 25 以上如果把很多次執行出來的結果去取平均，通常也在 25 以下，不像是正確的變異數這是因為程式（以及現行教科書）所用的公式是 $$V_N = \frac{1}{N}\sum_{i=1}^N (x - \mu)^2$$ 而早期教科書所用的公式是 $$V_{N-1} = \frac{1}{N-1}\sum_{i=1}^N (x - \mu)^2$$ 這裡 $V_N$ 和 $V_{N-1}$ 都還是隨機變數，只是它們的公式很複雜。很神奇的是，如果把 $V_{N-1}$ 做很多次取平均，反而更接近正確的變異數 25。實際上，經過計算 $\mathbb{E}(V_{N-1}) = 25$ 而 $\mathbb{E}(V_{N}) = 25\cdot\frac{N-1}{N} = 24.75$。當然，這裡是刻意維持 $N = 100$，才會造成 $99/100$ 的偏差以現行的計算能力，只要直接取 $N$ 很大就好，畢竟 $\lim_{N-\rightarrow\infty} E(V_{N}) = \mathbb{E}(V_{N-1})$。 :::