# Chương 01: KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT ## 1.2.1 Phép thử và biến cố <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415391371_318517460520840_5472155182055115662_n.png?_nc_cat=107&ccb=1-7&_nc_sid=510075&_nc_ohc=CY13wpAe4xYAX-R2G2c&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdSZeJRs-P7AfiSOx9fkMezdkebP_r3qS_c6GH8v4GmvtA&oe=66094BC9> </center> Bài Giải: (a) Có $2^5 = 32$ biến cố sơ cấp trong không gian mẫu của thí nghiệm này. (b) * Gọi $B$ là biến cố để bộ phận 1 và 2 đều hoạt động $\to x_1 = 1 \wedge x_2 = 1$. $\Rightarrow B = \{\{1;1;0;0;0\},\{1;1;1;0;0\},\{1;1;0;1;0\}, \{1;1;0;0;1\}, \{1;1;1;1;0\}, \{1;1;1;0;1\}, \{1;1;0;1;1\}, \{1;1;1;1;1\}\}$ * Gọi $C$ là biến cố để bộ phận 3 và 4 đều hoạt động $\to x_3 = 1 \wedge x_4 = 1$. * Gọi $D$ là biến cố để bộ phận 1, 3 và 5 đều hoạt động $\to x_1 = 1 \wedge x_3 = 1 \wedge x_5 = 1$. Ta có: $W$ là biến cố hệ thống hoạt động thì $W = B + C + D$ ( c ) Ta có $A$ là biến cố bộ phận 4 và 5 đều bị hỏng nên biến cố sơ cấp của thì $x_4 = x_5 = 0$ còn $x_1, x_2, x_3 \in \{0; 1\} \Rightarrow A$ có $2^3 = 8$ biến cố sơ cấp. (d) Hãy biểu diễn $AW = \{\{1,1,1,0,0\}, \{1,1,0,0,0\}\}$ <center> <img src = https://scontent.fsgn2-7.fna.fbcdn.net/v/t1.15752-9/415516039_752694213402717_8018760032495143821_n.png?_nc_cat=100&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=BUlPN7lLL6QAX_CIj9v&_nc_ht=scontent.fsgn2-7.fna&oh=03_AdRvzxGLyHm3yopuwPW5vuSsXJvNIdZWVgrNyqOFydFm2w&oe=66094B2C> </center> Bài Giải: (a) Có đúng một sinh viên đạt yêu cầu Gọi $A$ là biến cố để có đúng một sinh viên đạt yêu cầu $\Rightarrow A = B_1.\overline{B_2}.\overline{B_3}.\overline{B_4}+ \overline{B_1}.B_2.\overline{B_3}.\overline{B_4} + \overline{B_1}.\overline{B_2}.B_3.\overline{B_4} + \overline{B_1}.\overline{B_2}.\overline{B_3}.B_4$ (b) Có đúng ba sinh viên đạt yêu cầu Gọi $C$ là biến cố để có đúng 3 sinh viên đạt yêu cầu $\Rightarrow C = B_1.B_2.B_3.\overline{B_4} + \overline{B_1}.B_2.B_3.B_4 + B_1.B_2.\overline{B_3}.B_4 + B_1.\overline{B_2}.B_3.B_4$ ( c ) Có ít nhất một sinh viên đạt yêu cầu Gọi $D$ là biến cố để có ít nhất một sinh viên đạt yêu cầu $\Rightarrow \overline{D}$ là biến cố để không có sinh viên nào đạt yêu cầu. $\Rightarrow D = (B_1.\overline{B_2}.\overline{B_3}.\overline{B_4}+ \overline{B_1}.B_2.\overline{B_3}.\overline{B_4} + \overline{B_1}.\overline{B_2}.B_3.\overline{B_4} + \overline{B_1}.\overline{B_2}.\overline{B_3}.B_4)$ $+ (B_1B_2.\overline{B_3}.\overline{B_4} + B_1.\overline{B_2}.B_3.\overline{B_4} + B_1.\overline{B_2}.\overline{B_3}.B_4 + \overline{B_1}.B_2.B_3.\overline{B_4} + \overline{B_1}.B_2.\overline{B_3}.B_4 + \overline{B_1}.\overline{B_2}.B_3.B_4)$ $+(B_1.B_2.B_3.\overline{B_4} + \overline{B_1}.B_2.B_3.B_4 + B_1.B_2.\overline{B_3}.B_4 + B_1.\overline{B_2}.B_3.B_4) + B_1.B_2.B_3.B_4$ (d) Không có sinh viên nào đạt yêu cầu Gọi $E$ là biến cố để không có sinh viên nào đạt yêu cầu $\Rightarrow E = \overline{B_1}.\overline{B_2}.\overline{B_3}.\overline{B_4}$ ## 1.2.3 Các công thức xác suất cơ bản <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/416137434_902722174596770_7402141066205824546_n.png?_nc_cat=101&ccb=1-7&_nc_sid=510075&_nc_ohc=Qdex4vj59LkAX_Tq0Kt&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdSFlQ45WnZT40okRI_65ojCPNaGt1l87pZWSKvZZT_4_w&oe=660952BD> </center> Bài Giải Theo đề bài, ta có: Xác suất để chọn được hộ giàu có là: $\mathbb{P}(A) = 0.138$ Xác suất để chọn được hộ trí thức là: $\mathbb{P}(B) = 0.261$ Xác suất để có chọn được cả 2 hộ gia đình trí thức và giàu có là: $\mathbb{P}(A.B) = 0.082$ (a) Tính xác suất chọn một gia đình hoặc là giàu có hoặc là trí thức. Gọi $C$ là biến cố "chọn một gia đình hoặc là giàu có hoặc là trí thức" $\Rightarrow C = A + B$ $\Rightarrow \mathbb{P}(C) \equiv \mathbb{P}(A + B) = \mathbb{P}(A) + \mathbb{P}(B) - \mathbb{P}(A.B) = 0.317$ (b) Vẽ biểu đồ Venn biểu diễn mối quan hệ hai biến cố A và B <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415223965_1056057208948430_2986629654032317135_n.png?_nc_cat=109&ccb=1-7&_nc_sid=510075&_nc_ohc=3_ni0qGAFw8AX870Gez&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdREopaUjxHEz5hoW29s0sKuM6xSogPo4noHWg41YUmrvw&oe=66096B2C> </center> ( c ) Biểu diễn và tính các xác suất: * $\mathbb{P}(A.\overline{B}) = \mathbb{P}(A) - \mathbb{P}(A.B) = 0.138 - 0.082 = 0.056$ * $\mathbb{P}(\overline{A}.B) = \mathbb{P}(B) - \mathbb{P}(A.B) = 0.261 - 0.082 = 0.179$ * $\mathbb{P}(\overline{A}.\overline{B}) = \mathbb{P}(\overline{A + B}) = 1 - \mathbb{P}(A + B) = 1 - 0.317 = 0.683$ <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/416165264_899212101691412_8845647467099232140_n.png?_nc_cat=102&ccb=1-7&_nc_sid=510075&_nc_ohc=sCfFiyQw69UAX9OFpf0&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdSgmQCyWK5jbSXkCzp1x0cJua7iryCpL5UvzHc2dm3RQg&oe=66095D1C> </center> Bài Giải Gọi A là biến cố để người mắc bệnh tim trong một vùng dân cư. Gọi B là biến cố để người mắc bệnh huyết áp trong một vùng dân cư. Theo đề bài, ta có: * Xác suât người mắc bệnh tim là: $\mathbb{P}(A) = 9\%$ * Xác suất người mắc bệnh huyết áp là: $\mathbb{P}(B) = 12\%$ * Xác suất để ngưới mắc cả 2 bệnh là: $\mathbb{P}(A.B) = 7\%$ (a) $\mathbb{P}(A + B) = \mathbb{P}(A) + \mathbb{P}(B) - \mathbb{P}(AB) = 14\%$ (b) $\mathbb{P}(\overline{A}.\overline{B}) = \mathbb{P}(\overline{A + B} = 1 - \mathbb{P}(A + B) = 1 - 14\% = 86\%$ ( c ) $\mathbb{P}(\overline{A} + \overline{B}) = \mathbb{P}(\overline{AB}) = 1 - \mathbb{P}(AB) = 1 - 7\% = 93\%$ (d) $\mathbb{P}(A.\overline{B}) = \mathbb{P}(A) - \mathbb{P}(A.B) = 9\% - 7\% = 2\%$ (e) $\mathbb{P}(\overline{A}.B) = \mathbb{P}(B) - \mathbb{P}(AB) = 12\% - 7\% = 5\%$ <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415459332_309917414814025_4920101826991429478_n.png?_nc_cat=103&ccb=1-7&_nc_sid=510075&_nc_ohc=vEZmjhR3NqkAX-ZtHwP&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdSOgeStTTMrzgpuoJOfiGTWA8AZetorjDT6Wk3c-cu9zQ&oe=66094DF3> </center> Bài Giải (a) Xác suất nhóm máu O ở Hoa Kỳ là: $\mathbb{P}(O) = 1 - 0.4 - 0.11 - 0.04 = 0.45$ (b) Vì 2 biến cố có xác suất nhóm máu B và O là 2 biến cố xung khắc (tức là, $B \cap O = \emptyset$) $\Rightarrow \mathbb{P}(B + O) = \mathbb{P}(B) + \mathbb{P}(O) = 0.11 + 0.45 = 0.56$ ## 1.2.4 Xác suất có điều kiện <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415732442_1094859648596855_1408625988710163339_n.png?stp=dst-png_p403x403&_nc_cat=109&ccb=1-7&_nc_sid=510075&_nc_ohc=_fSgBBUUcWIAX8sh631&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdRCAG3qhRsrVujyTOSMFrJyw9cSAy7q7tAWHbOTImdPtw&oe=66094695> </center> Bài Giải (a) Xác xuất lấy ngẫu nhiên một điểm dưới B là: $\mathbb{P}(A) = 0.3656$ (b) Xác suất lấy 1 điểm ngẫu nhiên từ Khoa kĩ thuật và vật lý là: $\mathbb{P}(B) = \frac{1600}{10000} = 0.16$ $\Rightarrow \mathbb{P}(AB) = \frac{800}{10000} = 0.08$ $\Rightarrow \mathbb{P}(A|B) = \frac{\mathbb{P}(AB)}{\mathbb{P}(B)} = \frac{0.08}{0.16} = 0.5$ ( c ) Xác suất lấy ngẫu nhiên 1 điểm từ khoa sức khỏe là: $\mathbb{P}(C) = 0.21$ (d) Xác suất lấy ngẫu nhiên một điểm A là: $\mathbb{P}(D) = 0.3392$ (e) $\mathbb{P}(C|D) = \frac{\mathbb{P}(CD)}{\mathbb{P}(D)} = \frac{0.0882}{0.3392} = 0.26$ <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415396770_740823937962108_1593358980989682981_n.png?stp=dst-png_p403x403&_nc_cat=100&ccb=1-7&_nc_sid=510075&_nc_ohc=A4SvXHxmif4AX8vAK76&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdR0pq2B6H_mID06QehynX740Q8tJCKlegmK8zeuTG1xfw&oe=66097441> </center> Bài Giải (a) 40% (b) 70% ( c ) Xác suất dự báo thời tiết là trời nắng đúng là: $\mathbb{P}(A) = 44\%$ Xác suất trời mưa đúng thực tế là: $\mathbb{P}(B) = 34\%$ $\mathbb{P}(B|A) = \frac{\mathbb{P}(BA)}{\mathbb{P}(A)} = \frac{10\%}{44\%} = 0.227$ 0.09% và 0.681% <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/417088484_1534654620721475_3067874214165180807_n.png?_nc_cat=111&ccb=1-7&_nc_sid=510075&_nc_ohc=uHhQzWEnAEMAX8uR_ZZ&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdRcObA2sXbFF0WR8ojW-R8klaAfB9-xSN1DoolKs1tmTA&oe=66095554> </center> Bài Giải (a) $\mathbb{P}(A) = 0.4$ $\mathbb{P}(B) = 0.5$ $\mathbb{P}(A|B) = 0.7$ Gọi C là biến cố một cặp vợ chồng xem xem chương trình $\mathbb{P}(AB) = \mathbb{P}(A|B)*\mathbb{P}(B) = 0.7 * 0.5 = 0.35$ (b) $\mathbb{P}(B|A) = \frac{\mathbb{P}(BA)}{\mathbb{P}(A)} = 0.875$ ( c ) $\mathbb{P}(E) = \mathbb{P}(A + B) = (\mathbb{P}(A) + \mathbb{P}(B) - \mathbb{P}(AB)) = 0.55$ <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415483498_889754266185902_5723086685811994957_n.png?_nc_cat=109&ccb=1-7&_nc_sid=510075&_nc_ohc=CVTmWRcKVfQAX-1VQhq&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdSkPn_uOEBOdeUDu8ru1i5hyGxTnxqbFkTIb00-T2k0ZQ&oe=66095723> </center> Bài Giải $\mathbb{P}(A) = 25\%$ $\mathbb{P}(B) = 35\%$ $\mathbb{P}(C) = 40\%$ Gọi H la biến cố lấy một sản phẩm hỏng $\mathbb{P}(H) = \mathbb{P}(H|A) * \mathbb{P}(A) + \mathbb{P}(H|B) * \mathbb{P}(B) + \mathbb{P}(H|C) * \mathbb{P}(C) = 0.01 * 0.25 + 0.02 * 0.35 + 0.025 * 0.4 = 0.0195$ <center> <img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/415622414_1106968766969188_6324454251762574487_n.png?_nc_cat=102&ccb=1-7&_nc_sid=510075&_nc_ohc=LGjhRJ5Gzx0AX8JsxIy&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdR3jQEwmnIawqBjFabH9R356lxvRq2Viu7HYC13V52XtQ&oe=66094840> </center> Bài Giải --- # :pushpin: CHƯƠNG :two: : BIẾN NGẪU NHIÊN ## I. Biến ngẫu nhiên ### 1. Phân loại biến ngẫu nhiên * BT Thêm 2.1.1 (Supplemental exercises) * ### 2. Quy luật phân phối xác suất ### 3. Các đặc trưng số ## II. Một số phân phối xác suất thông dụng ### 1. Phân phối nhị thức -`Biominal distribution` #### 1.1. Ôn tập lý thuyết :::info * **++Định nghĩa++** Cho biến ngẫu nhiên rời rạc $X$ nhận giá trị $\{0;1;2;...;n\}$ với $n \in \mathbb{N}$. Ta nói $X$ có phân phối nhị thức, kí hiệu $X \sim \mathcal{B}(n,p)$, khi hàm trọng lượng xác suất là, với $x \in \mathbb{N}$, $$\begin{split}f(x)=\mathbb{P}(X = x) = \begin{cases}C^x_n \times p^x \times (1-p)^{n-x} &,với \quad x = \overline{\rm 0;1;2;3;...;n} \\0 &,khác\end{cases}\end{split}$$ trong đó $0 < p < 1$ Chú ý: Trong trường hợp $n = 1$, ta có **phân phối Bernoulli**. * **++Các đặc trưng số++** Cho biến ngẫu nhiên $X \sim \mathcal{B}(n ; p)$ với $n \in \mathbb{N}$ và $0 < p < 1$, ta có * Kỳ vọng (trung bình): $\mathbb{E}(X) = n.p$ * Phương sai: $Var(X) = n.p.(1-p)$ * $Mod(X)$ là các số nguyên thỏa $n \times p + p - 1 \leq Mod(X) \leq n \times p + p$ ++Nhận xét++ Với $n = 1$, kết quả tương ứng với trường hợp **phân phối Bernoulli**. * **++Mệnh đề++** Cho hai biến ngẫu nhiên $X \sim \mathcal{B}(n_1;p)$ và $Y \sim \mathcal{B}(n_2; p)$ với $0 < p < 1$. Nếu $X$ và $Y$ độc lập thì $X + Y \sim \mathcal{B}(n_1 + n_2; p)$ ::: #### 1.2. Bài tập thực hành * **==BT Thêm 2.2.1 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn10-1.fna.fbcdn.net/v/t1.15752-9/427915203_1063025208248163_4979352720461730320_n.png?_nc_cat=109&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=wtcjwHQVf4cAX9mK0dj&_nc_ht=scontent.fsgn10-1.fna&oh=03_AdQe7lzMQQ-WtTpCW8D8J48x4XEkUrUnj92Cfal5iSwxzw&oe=65FA6602> </center> :100: ++**==Answer==**++ :::spoiler Ta quan tâm số cây ra rễ trong tổng số 5 cây được trồng. Gọi $Y$ là biến ngẫu nhiên rời rạc thể hiện số cây ra rễ trong tổng số 5 cây được trồng độc lập. $\implies Y$ có phân phối nhị thức $\mathcal{B}(n;p)$ với $n = 5$ và $p =$ `"xác suất để một cây ra rễ"` $= 0.8$. $\implies Y \sim \mathcal{B}(5;0.8)$ a) Xác suất để mọi cây đều lên rễ là: $$\begin{split}\mathbb{P}(Y=5)&=C^5_n \times p^5 \times (1-p)^{n-5} = C^5_5\times 0,8^5 \times (1-0,8)^{5-5} \\&= 0,8^5 = 0,32768\end{split}$$ b) Xác suất để có đúng một cây lên rễ là: $$\begin{split}\mathbb{P}(Y=1) &= C^1_n \times p^1 \times (1-p)^{n-1} \\ &= C^1_5 \times 0,8^1 \times (1-0,8)^{5-1} \approx 6,4 \times 10^{-3}\end{split}$$ c) Xác suất để có ít nhất ba cây lên rễ là: $$\begin{split}\mathbb{P}(Y\geq3) &= \mathbb{P}(Y = 3) + \mathbb{P}(Y=4)+\mathbb{P}(Y=5) \\ &= C^3_5 \times 0,8^3 \times(1-0,8)^{5-3} + C^4_5 \times 0,8^4 \times (1-0,8)^{5-4} \\ &+ C^5_5 \times 0,8^5 \times (1-0,8)^{5-5} \approx 0,94208\end{split}$$ ::: * **==Bài tập 2.68==** <center> <img src = https://scontent.fsgn10-2.fna.fbcdn.net/v/t1.15752-9/427810801_1616506215767540_1464931805398995274_n.png?_nc_cat=103&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=SL0t3iSXry8AX-v7RVr&_nc_ht=scontent.fsgn10-2.fna&oh=03_AdTqxJvcP_7FOwffsg7jaD7FJ--tG-NUeBqMyff57MLueg&oe=65FA6789> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên rời rạc thể hiện số câu trả lời đúng của thí sinh trong tổng số 12 câu hỏi độc lập nhau. $\implies Y$ có phân phối nhị thức $\mathcal{B}(n;p)$ với $n = 12$ và $p =$ `"xác suất để trả lời đúng 1 câu hỏi"` $=\displaystyle\frac{1}{5} = 0.2$. $\implies Y \sim \mathcal{B}(12 ; 0.2)$ Tổng số điểm của thí sinh đạt được là: $4.Y - 1.(12 - Y) =5.Y - 12$ a) Xác suất để thí sinh được $13$ điểm sẽ tính như sau: * Thí sinh đạt 13 điểm tức là: $5.Y - 12 = 13 \implies Y = 5$ * Xác suất để thí sinh này được $13$ điểm là: $$\begin{split}\mathbb{P}(Y = 5) &= C^5_{12} \times 0,2^5 \times 0,8^{12-5} &\approx 0,0532\end{split}$$ b)Xác suất để thí sinh bị âm điểm sẽ được tính như sau: * Điều kiện của thí sinh bị âm điểm tức là: $5.Y - 12 < 0 \Leftrightarrow Y < 2.4 \Leftrightarrow Y \leq 2$ * Xác suất để thí sinh bị âm điểm là: $$\begin{split}\mathbb{P}(Y \leq 2) &= \mathbb{P}(Y = 0) + \mathbb{P}(Y = 1) + \mathbb{P}(Y = 2) \\ &= C^0_{12} \times 0.2^0 \times (1-0.2)^{12 - 0} + C^1_{12} \times 0.2^1 \times (1 - 0.2)^{12 - 1} \\ &+ C^2_{12} \times 0.2^2 \times (1-0.2)^{12 - 2} \approx 0,5584\end{split}$$ ::: * **==Bài tập 2.74==** <center> <img src = https://scontent.fsgn2-7.fna.fbcdn.net/v/t1.15752-9/427766192_363712399889038_9194451645959978856_n.png?_nc_cat=100&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=xOzuTjECOoIAX_afc94&_nc_ht=scontent.fsgn2-7.fna&oh=03_AdT8EjrVeLHxDKTJ8BBnKGt3APSPPgNxj4-FS8BrW8l7Mw&oe=65FB1537> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên rời rạc thể hiện số bệnh nhân hồi phục bệnh đau dạ dày trong tổng số $20$ bệnh nhân được khảo sát độc lập. $\implies$ $Y$ có phân phối nhị thức $\mathcal{B}(n; p)$ với $n = 20$ và $p =$ `"xác suất để một bệnh nhân đau dạ dày hồi phục"` $= 0.8$. $\implies$ $Y \sim \mathcal{B}(20; 0.8)$ a) Xác suất để có đúng $14$ người hồi phục là: $$\begin{split}\mathbb{P}(Y = 14) &= C^{14}_n \times p^{14} \times (1-p)^{n-14} \\&= C^{14}_{20} \times 0.8^{14} \times (1-0.8)^{20-14} \approx 0.1091\end{split}$$ b) Xác suất để có ít nhất $10$ người hồi phục: $$\begin{split}\mathbb{P}(Y \geq 10) &= \displaystyle \sum_{k=10}^{20}C^k_{20} \times p^k \times (1-p)^{20-k} \\ &= \displaystyle \sum_{k=10}^{20}C^k_{20} \times 0.8^k \times (1-0.8)^{20-k} \approx 0.9994365863\end{split}$$ c) Xác suất để ít nhất là $14$ người hồi phục nhưng không quá $18$ người phục: $$\begin{split}\mathbb{P}(14 \leq Y \leq 18) &= \displaystyle \sum^{18}_{k=14}C^{k}_{20} \times p^k \times (1-p)^{20-k} \\ &= \displaystyle \sum^{18}_{k=14}C^{k}_{20} \times 0.8^k \times (1-0.8)^{20-k} \approx 0.844132\end{split}$$ d) Xác suất để có nhiều nhất $16$ người hồi phục: $$\begin{split}\mathbb{P}(Y \leq 16) &= \displaystyle \sum_{k=0}^{16}C^k_{20} \times p^k \times (1-p)^{20-k} \\ &= \displaystyle \sum_{k=0}^{16}C^k_{20} \times 0.8^k \times (1-0.8)^{20-k} \approx 0.588551138\end{split}$$ ::: * **==Bài tập 2.80==** <center> <img src = https://scontent.fsgn2-3.fna.fbcdn.net/v/t1.15752-9/427838837_742295747868800_5379757200973036665_n.png?_nc_cat=107&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=APZdzR1I2IwAX_eET_D&_nc_ht=scontent.fsgn2-3.fna&oh=03_AdRe_N10xlVB_A4yFIJYpYfbb5HzBHxWNG_wBC7J1JQ0ug&oe=65FB1EA5> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên thể hiện số con cá sống sót trong tổng số $20$ con cá đặt trong một chiếc thùng chứa nồng độ của hóa chất trong nước. $\implies$ $Y$ có phân phối nhị thức $\mathcal{B}(n;p)$ với $n = 20$ và $p =$ `"xác suất để một con cá sống sót trong thùng chứa"` $= \displaystyle \frac{(100\% - 20\%).20}{20} = 0,8$ $\implies Y \sim \mathcal{B}(20; 0.8)$ a) Xác suất để có chính xác $14$ con cá sống sót là: $$\mathbb{P}(Y = 14) = C^{14}_{20} \times 0.8^{14} \times (1-0.8)^{20-14} \approx 0.10901$$ b) Xác suất có ít nhất $10$ con cá sống sót là: $$\mathbb{P}(Y \geq 10) = \displaystyle \sum_{k=10}^{20}C^k_{20} \times p^k \times (1-p)^{20-k} \approx 0.9994365863$$ c) Xác suất có nhiều nhất $16$ con cá sống sót là: $$\mathbb{P}(Y \leq 16) = \displaystyle \sum_{k=0}^{16}C^k_{20} \times p^k \times (1-p)^{20-k}\approx0.588551138$$ d) Trung bình và phương sai của số con cá sống sót lần lượt là: * Trung bình (kỳ vọng): $$\mathbb{E}(Y) = n \times p = 20 \times 0.8 = 16$$ * Phương sai: $$Var(Y) = n \times p \times (1-p) = 20 \times 0.8 \times (1-0.8) = 3.2$$ ::: * **==BT thêm 2.2.2 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-3.fna.fbcdn.net/v/t1.15752-9/428925883_412889034548696_4876361015939936166_n.png?_nc_cat=107&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=dBf1Za70hpAAX_kBW2W&_nc_ht=scontent.fsgn2-3.fna&oh=03_AdTU3fyEn0rRiK82-cGyi_4Apqaal5jRLSZ9vbhXX_3wrg&oe=65FB2D2F> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên thể hiện số câu trả lời đúng trong tổng số $25$ câu hỏi. $\implies Y$ có phân phối nhị thức $\mathcal{B}(n;p)$ với $n = 25$ và $p =$ `"xác suất để một câu đúng trong 4 câu trả lời của một câu hỏi"` $= 0.25$ $\displaystyle \implies Y \sim \mathcal{B}(25;0.25)$ a) Xác suất để học sinh đó có nhiều hơn $20$ câu trả lời đúng là: $$\begin{split}\mathbb{P}(Y > 20) &= \mathbb{P}(Y \geq 21) \\ &= \mathbb{P}(Y = 21) + \mathbb{P}(Y = 22) + \mathbb{P}(Y = 23) + \mathbb{P}(Y = 24) + \mathbb{P}(Y = 25) \\ &= C^{21}_{25} \times 0.25^{21} \times (1-0.25)^{25-21} + C^{22}_{25} \times 0.25^{22} \times (1-0.25)^{25-22}\\ &+ C^{23}_{25} \times 0.25^{23} \times (1-0.25)^{25-23} + C^{24}_{25} \times 0.25^{24} \times (1-0.25)^{25-24} \\&+ C^{25}_{25} \times 0.25^{25} \times (1-0.25)^{25-25} \\ &\approx 9.6769 \times 10^{-10} \end{split}$$ b) Xác suất để học sinh đó có ít hơn $5$ câu trả lời đúng là: $$\mathbb{P}(Y < 5) = \mathbb{P}(Y \leq 4) = \displaystyle \sum_{k = 0}^{4}C^k_{25} \times 0.25^k \times (1-0.25)^{25 - k} \approx 0.213741$$ c) Giả sử bài kiểm tra trắc nghiệm có $200$ câu hỏi thì lúc này $n = 200$ $\implies Y \sim \mathcal{B}(200; 0.25)$ * Ở đây, ta có thể chọn xấp xỉ phân phối nhị thức bằng phân phối Poisson hay phân phối chuẩn. Tuy nhiên, do thông thường, phân phối Poisson $\mathcal{P}(n.p)$ xấp xỉ tốt cho phân phối nhị thức $\mathcal{B}(n, p)$ khi $n \geq 100, p \leq 0.01$ và $n.p \leq 20$ mà ở đây bài toán không thể đáp ứng hết tất cả điều kiện nên ta sẽ sử dụng xấp xỉ phân phối nhị thức bằng phân phối chuẩn. * Do $n$ đủ lớn, ta có thể xấp xỉ phân phối nhị thức bằng phân phối chuẩn $\mathcal{N}(n.p, n.p.(1-p))$ $\implies Y$ có thể được xem là biến ngẫu nhiên có phân phối chuẩn với độ trung bình $\mu = \mathbb{E}(Y) = n\times p = 200 \times 0.25 = 50$ và độ lệch chuẩn $\sigma = \sqrt{Var(Y)} = \sqrt{n \times p \times (1-p)} = \displaystyle \frac{5\sqrt{6}}{2}$ * Xác suất để học sinh đó có ít nhất $100$ câu trả là: $$\begin{split}\mathbb{P}(Y \geq 100) &= 1 - \mathbb{P}(Y < 100) \\ &= 1 - \mathbb{P}(\displaystyle \frac{Y - \mu}{\sigma} < \displaystyle \frac{100 -\mu}{\sigma}) \\ &= 1 - \Phi(\displaystyle \frac{10\sqrt{6}}{3}) \\ &\approx 0.002 \end{split}$$ ::: ### 2. Phân phối Poisson - `Poisson distribution` #### 2.1. Ôn tập lý thuyết :::info * **++Định nghĩa++** Cho biến ngẫu nhiên rời rạc $X$ nhận các giá trị $\{0;1;2;3;...\}$. Ta nói $X$ có phân phối Poisson với tham số $\lambda > 0$, ký hiệu $X \sim \mathcal{P}(\lambda)$, khi hàm trọng lượng xác suất là: $$\begin{split}f(x) = \mathbb{P}(X = x) = e^{-\lambda} . \displaystyle \frac{\lambda^x}{x!}\end{split}$$ với $x = \overline{\rm 0; 1; 2; 3; ...}$ và $\lambda$ là số lần trung bình xuất hiện biến cố ngẫu nhiên $X$ trong một đơn vị thời gian hoặc không gian. * **++Các đặc trưng số++** Cho biến ngẫu nhiên $X$ có phân phối Poisson với tham số $\lambda > 0$, $X \sim \mathcal{P}(\lambda)$, ta có: * Kỳ vọng (trung bình): $\mathbb{E}(X) = \lambda$ * Phương sai: $Var(X) = \lambda$ * **++Mệnh đề++**: * Xấp xỉ phân phối nhị thức $\mathcal{B}(n;p)$ bằng phân phối Poisson * ++Định lý (Giới hạn Poisson)++: Cho biến ngẫu nhiên $X$ có phân phối nhị thức, $X \sim \mathcal{B}(n;p)$, với $0 < 1 < p$ và $n \in \mathbb{N}, n \leq 1$. Nếu $n \times p \to \theta$ khi $n \to +\infty$ và $p \to 0$, thì $$\begin{split} \displaystyle \lim_{\begin{cases}n \to +\infty \\ p \to 0\end{cases}} \mathbb{P}(X = x) = e^{-\theta}\times\displaystyle\frac{\theta^x}{x!}\end{split}$$ Định lý trên cho thấy: đối với phân phối nhị thức $\mathcal{B}(n;p)$ nếu $n$ đủ lớn và $p$ nhỏ, thì đặt $\lambda = n.p$ và ta có thể dùng phân phối Poisson để tính xấp xỉ các xác suất (ứng với phân phối $\mathcal{B}(n;p)$) Thông thường, phân phối Poisson $\mathcal{P}(n.p)$ xấp xỉ tốt cho phân phối nhị thức $\mathcal{B}(n, p)$ khi $n \geq 100, p \leq 0.01$ và $n.p \leq 20$ * Cho hai biến ngẫu nhiên $X \sim \mathcal{P}(\lambda_1)$ và $Y \sim \mathcal{P}(\lambda_2)$. Nếu $X$ và $Y$ độc lập nhau thì $X + Y \sim \mathcal{P}(\lambda_1 + \lambda_2)$ ::: #### 2.2. Bài tập thực hành * **==Bài tập 2.100==** <center> <img src = https://scontent.fsgn2-7.fna.fbcdn.net/v/t1.15752-9/428246872_969778324769683_3865013088119982549_n.png?_nc_cat=100&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=PF_hOZezHl4AX9_NMzR&_nc_ht=scontent.fsgn2-7.fna&oh=03_AdREoudwIPxGDEmHCaTNzMJyN_gXfkyc5orDU0XP_2jJEA&oe=65FB3FFC> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên Poisson thể hiện số lượng khách hàng bước vào ngân hàng trong một giờ. $\implies X$ có phân phối Poisson với tham số $\lambda > 0$ $\implies X \sim P(\lambda)$ Ta có: $$\mathbb{P}(X = 0) = 0.05 \Leftrightarrow e^{-\lambda}.\displaystyle \frac{\lambda^0}{0!} = 0.05 \Leftrightarrow e^{-\lambda} = 0.05 \Leftrightarrow \lambda = ln(20)$$ * Xác định giá trị trung bình và phương sai của X lần lượt là: * Trung bình (kỳ vọng): $$\mathbb{E}(X) = \lambda = ln(20)$$ * Phương sai: $$Var(X) = \lambda = ln(20)$$ ::: * **==Bài tập 2.107==** <center> <img src = https://scontent.fsgn2-4.fna.fbcdn.net/v/t1.15752-9/428041956_947490453605992_7913948868966377202_n.png?_nc_cat=101&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=uIxJg7jpyGQAX_6wbFX&_nc_ht=scontent.fsgn2-4.fna&oh=03_AdRgPwzOJWamBgsRMN8qW8c6TFztIIpHnFoN0dN3UyGpIA&oe=65FB1440> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên thể hiện số khách hàng đến một quầy thanh toán tại một siêu thị trong một giờ. $\implies Y$ có phân phối Poisson với tham số $\lambda > 0$ $\implies Y \sim P(\lambda)$ Ta có: trung bình (kỳ vọng) $= 7 \Leftrightarrow \mathbb{E}(X) = 7 \Leftrightarrow \lambda = 7$ * Xác suất để không có hơn 3 khách hàng đến là: $$\mathbb{P}(Y \leq 3) = \displaystyle \sum_{k = 0}^{3}e^{-7}.\displaystyle \frac{7^k}{k!} \approx 0.08176541624$$ * Xác suất để có ít nhất 2 khách hàng đến là: $$\mathbb{P}(Y \geq 2) = 1 - \mathbb{P}(Y < 2) = 1 - \mathbb{P}(Y \leq 1) = 1 - \displaystyle \sum_{k = 0}^{1}e^{-7}.\displaystyle\frac{7^k}{k!} \approx 0.9927$$ * Xác suất để có chính xác 5 khách hàng đến là: $$\mathbb{P}(Y = 5) = e^{-7}.\displaystyle \frac{7^5}{5!} \approx 0.12772$$ ::: * **==BT thêm 2.2.2 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-10.fna.fbcdn.net/v/t1.15752-9/428413218_393186129971664_8416530916554635612_n.png?_nc_cat=109&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=rmxTo--OH98AX-FDuWi&_nc_ht=scontent.fsgn2-10.fna&oh=03_AdQ-CCC1eL7khxLtpDGV6L98Q-s8uS42y596aW0gi6CiWg&oe=65FB3B0D> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên rời rạc thể hiện số lần một sinh viên kiểm tra email mỗi ngày $\implies X$ có phân phối Poisson $P(\lambda)$ với tham số $\lambda > 0$ Ta có: trung bình (kỳ vọng) $= \mathbb{E}(X) = \lambda = 7$ a) Xác suất để ngày đó là "ít hoạt động" là: $$\begin{split}\mathbb{P}(X \leq 3) &= \displaystyle \sum_{k = 0}^{3} e^{-\lambda} \times \displaystyle\frac{\lambda^k}{k!} \approx 0.082 \end{split}$$ b) Tháng 3 có 31 ngày. Gọi $Y$ là biến ngẫu nhiên rời rạc độc lập thể hiện số ngày sinh viên ít hoạt động trong 1 tháng có $m$ ngày. $\implies Y$ có phân phối nhị thức $\mathcal{B}(n;p)$ với $n = 31$ và $p =$ `"xác suất để một ngày được xem là ít hoạt động"` $= 0.082$. $\implies Y \sim \mathcal{B}(31; 0.082)$ Số ngày trung bình được xem là ít hoạt động trong tháng 3 năm 2021 là: $$\mathbb{E}(Y) = n \times p = 31 \times 0.082 \approx 2.542$$ c) Gọi $Z$ là số ngày "ít hoạt động" của một sinh viên trong vòng một năm (365 ngày) (đơn vị : ngày) $\implies Z$ có phân phối nhị thức $\mathcal{B}(n_Z, p_Z)$ với $n_Z = 365$ và $p_Z =$ `"xác suất để một ngày được xem là ít hoạt động"` $= 0.082$. $\implies Z \sim \mathcal{B}(365; 0.082)$ Xác suất trong một năm sinh viên đó có từ $32$ đến $86$ ngày "ít hoạt động" là: $$\begin{split} \mathbb{P}(32 \leq Z \leq 86) &= \displaystyle \sum_{k = 32}^{86} C^k_{365} \times p^k \times (1-p)^{365 - k} \\ &= \displaystyle \sum_{k = 32}^{86} C^k_{365} \times 0.082^k \times (1-0.082)^{365 - k} \approx 0.00003\end{split}$$ ::: * **==Bài tập 2.110==** <center> <img src = https://scontent.fsgn2-6.fna.fbcdn.net/v/t1.15752-9/429088141_3560069114215425_5228592180412252054_n.png?_nc_cat=110&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=HFnoYMwlFegAX8Fxwos&_nc_ht=scontent.fsgn2-6.fna&oh=03_AdSNCndC3wjNizSimrVANSh0xxNoevM5ulO11_Kx4S1uRQ&oe=65FB7F86> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên thể hiện số sự cố mỗi ngày của máy cắt và $R$ là tổng doanh thu hàng ngày của máy cắt. $\implies Y$ có phân phối Poisson $P(\lambda)$ với tham số $\lambda > 0$. Theo đề bài, ta có: $$\mathbb{E}(Y) = Var(Y) = \lambda = 2$$ Ta có: $$Var(Y) = \mathbb{E}(Y^2) - (\mathbb{E}(Y))^2 \Leftrightarrow 2 = \mathbb{E}(Y^2) - 2^2 \Leftrightarrow \mathbb{E}(Y^2) = 6$$ Doanh thu hàng ngày dự kiến là: $$\begin{split}\mathbb{E}(R) &= \mathbb{E}(1600 - 500Y^2) \\ &= 1600 - 500.\mathbb{E}(Y^2) \\ &= 1300 (dollars) \end{split}$$ ::: ### 3. Phân phối mũ - `Exponential distribution` #### 3.1. Ôn tập lý thuyết :::info * **++Định nghĩa++** Xét biến ngẫu nhiên liên tục thể hiện khoảng cách giữa hai successive events liên tiếp từ một Poisson process với $\lambda$ là số events trung bình trên mỗi khoảng đơn vị $\lambda > 0$. Khi đó, biến ngẫu nhiên liên tục $X$, với $\lambda > 0$ được gọi là có phân phối mũ, ký hiệu $X \sim Exp(\lambda)$, và hàm mật độ xác suất có dạng: $$\begin{split} f(x) = \begin{cases} \lambda.e^{-\lambda x} &, nếu \quad x \geq 0 \\ 0 &, nếu \quad x < 0 \end{cases} \end{split} $$ * **++Các đặc trưng số++** Cho biến ngẫu nhiên liên tục $X$ có phân phối mũ với tham số $\lambda > 0, X \sim Exp(\lambda)$, ta có: * Kỳ vọng (trung bình): $\mathbb{E}(X) = \displaystyle \frac{1}{\lambda}$ * Phương sai: $Var(X) = \displaystyle \frac{1}{\lambda^2}$ ::: #### 3.2. Bài tập thực hành * **==BT thêm 2.3.1 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-5.fna.fbcdn.net/v/t1.15752-9/429092153_1136933750821157_5096238928309593563_n.png?_nc_cat=104&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=hDZs4BpzH7AAX-8jUsh&_nc_ht=scontent.fsgn2-5.fna&oh=03_AdR8dFpnStflm9cQNKwUJn5n6mDbjD51iwayqWqe_9VZRg&oe=65FB5C83> </center> :100: ++**==Answer==**++ :::spoiler Ta quan tâm khoảng thời gian giữa 2 lần nhận email liên tiếp. Gọi $X$ là biến ngẫu nhiên liên tục thể hiện thời gian giữa 2 lần nhận email liên tiếp. $\implies X$ có phân phối mũ $Exp(\lambda)$ với $\lambda > 0$. Theo đề bài, ta có:`"thời gian giữa các lần email đến máy tính tuân theo phân phối mũ với trung bình là 2 giờ"`, nghĩa là trung bình (kỳ vọng) của X (đơn vị: giờ) là: $$\mathbb{E}(X) = 2 \Leftrightarrow \displaystyle \frac{1}{\lambda} = 2 \Leftrightarrow \lambda = \displaystyle \frac{1}{2}$$ (vì $X \sim Exp(\lambda)$) a) Xác suất để `không nhận được email nào trong vòng 2 giờ` có nghĩa là xác suất `thời gian giữa hai lần nhận email liên tiếp` $\geq 2$ `giờ`. Suy ra, $\mathbb{P}$("không nhận được email nào trong 2 giờ") $= \mathbb{P}$("thời gian giữa hai lần nhận email liên tiếp là $\geq 2$ giờ"), tức là: $$\begin{split}\mathbb{P}(X \geq 2) &= 1 - \mathbb{P}(X < 2) \\ &= 1 - \displaystyle \int_{-\infty}^{2}f(x)dx \\&= 1 - \displaystyle \int_{0}^{2}\lambda.e^{-\lambda.x}dx \\&= 1 - (-e^{-\lambda.x})|_{x = 0}^{x = 2}= e^{-1} \end{split}$$ b) Xác suất để bạn không nhận email nào trong vòng 2 giờ tiếp theo nếu bạn không nhận được email trong vòng 4 giờ qua là: $$\begin{split}\mathbb{P}(X \geq 6 | X \geq 4) &= \displaystyle \frac{\mathbb{P}(X \geq 6 \cap X \geq 4)}{\mathbb{P}(X \geq 4)} = \displaystyle \frac{\mathbb{P}(X \geq 6)}{\mathbb{P}(X \geq 4)} \\ &= \displaystyle \frac{\displaystyle \int_{6}^{+\infty}f(x)dx}{\displaystyle \int_{4}^{+\infty}f(x)dx} = \displaystyle \frac{\displaystyle \int_{6}^{+\infty}\lambda e^{-\lambda x} dx}{\displaystyle \int_{4}^{+\infty}\lambda e^{-\lambda x} dx} \\&= \displaystyle \frac{(-e^{-\lambda x}) \displaystyle |^{x=+\infty}_{6}}{(-e^{-\lambda x})\displaystyle |^{x=+\infty}_{4}} \\ &= \frac{e^{-3}}{e^{-2}} = e^{-1} \end{split}$$ c) Khoảng thời gian dự kiến giữa email thứ 5 và email thứ 6 mà bạn nhận là: do phân phối mũ không có tính nhớ lịch sử và các khoảng thời gian giữa 2 lần nhận email liên tiếp là độc lập cho nên khoảng thời gian dự kiến đó $= \mathbb{E}(X) = 2$ (giờ). Hay ta có thể dùng phân phối Poisson với $\lambda = \displaystyle \frac{1}{2}$ thì khoảng thời gian đó sẽ bằng $\displaystyle \frac{1}{\lambda} = 2$ (giờ) ::: * **==BT Thêm 2.3.2 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-6.fna.fbcdn.net/v/t1.15752-9/426828269_947622483561643_7870186086121809913_n.png?_nc_cat=110&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=galyJj7dxZ8AX8e3Ak7&_nc_ht=scontent.fsgn2-6.fna&oh=03_AdS4zJGbgqa6f8t6Y8j65jh2EQi0O1dU4TrgA89XylO6tA&oe=65FB6A33> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện thời gian giữa các lần xe taxi đến cổng trường ĐH KHTN hay nói cách khác, thời gian hành khách phải đợi chuyến taxi tiếp theo đến ĐH KHTN (đơn vị: phút) $\implies X$ có phân phối mũ với kỳ vọng (trung bình) $\mathbb{E}(X) = 10$ (phút) $$\Leftrightarrow \displaystyle \frac{1}{\lambda} = 10 \Leftrightarrow \lambda = \displaystyle \frac{1}{10}$$ $\implies X \sim Exp(\lambda) = Exp(\displaystyle \frac{1}{10})$ a) Nếu muốn đón taxi ở địa điểm này, xác suất để một hành khách phải đợi hơn 1 giờ (= 60 phút) là: $$\begin{split} \mathbb{P}(X > 60) &= 1 - \mathbb{P}(X \leq 60) \\ &= 1 - \displaystyle \int_{-\infty}^{60} f(x)dx = 1 - \displaystyle \int_{0}^{60} \lambda e^{-\lambda x} dx \\ &= 1 - (-e^{-\lambda x})|_{x=0}^{x=60} =e^{-6} \approx 2.47875\times10^{-3}\end{split}$$ b) Nếu một hành khách đã đợi một giờ (60 phút) nhưng vẫn chưa đón được taxi, xác suất để người này đón được taxi trong vòng 10 phút tới là: $$\begin{split} \mathbb{P}(X \leq 70 | X > 60) &= \displaystyle \frac{\mathbb{P}(X > 60 \cap X \leq 70)}{\mathbb{P}(X > 60)} = \displaystyle \frac{\mathbb{P}(60<X\leq70)}{\mathbb{P}(X > 60)} \\&= \displaystyle \frac{\displaystyle \int_{60}^{70}\lambda e^{-\lambda x} dx}{\displaystyle \int_{60}^{+\infty}\lambda e^{-\lambda x} dx} = \displaystyle \frac{(-e^{-\lambda x})|_{x = 60}^{x = 70}}{(-e^{-\lambda x})|_{x = 60}^{x =+\infty}} \approx 0.632121\end{split}$$ c) Tìm $m$ sao cho xác suất để một hành khách phải đợi hơn $m$ phút là $0.1$ là: $$\begin{split} \mathbb{P}(X > m) = 0.1 &\Leftrightarrow \mathbb{P}(X \leq m) = 1 - 0.1 = 0.9 \\ &\Leftrightarrow \displaystyle \int_{-\infty}^{m} \lambda e^{-\lambda x} dx = 0.9 \\ &\Leftrightarrow (-e^{-\lambda x})|_{x = 0}^{x = m} = 0.9 \\ &\Leftrightarrow e^{-\frac{m}{10}} = 0.1 \Leftrightarrow m = 10 \times (-ln0.1) \\ &\Leftrightarrow m \approx 23.026\end{split}$$ Vậy $m \approx 23.026$ (phút) ::: * **==Bài tập 2.170==** <center> <img src = https://scontent.fsgn5-15.fna.fbcdn.net/v/t1.15752-9/429059101_3616907648627304_1670044582225850504_n.png?_nc_cat=111&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=RPKNviSeTtAAX9RbBtX&_nc_ht=scontent.fsgn5-15.fna&oh=03_AdRyYFtfZc25DPtCTg89Y6R6umpDADJXWToXsVsFopuBxw&oe=65FB7BEF> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện thời gian để sản phẩm được chọn giảm giá một lần nữa (khoảng thời gian giữa 2 lần giảm giá liên tiếp của một sản phẩm) (đơn vị: ngày) $\implies X$ có phân phối mũ với $\lambda = \displaystyle \frac{1}{10} > 0$ (vì chọn ngẫu nhiên 1 sản phẩm trong 10 sản phẩm mỗi ngày) $\implies X \sim Exp(\displaystyle \frac{1}{10})$ a) Số ngày dự kiến cho đến khi sản phẩm này giảm giá một lần nữa là: $\mathbb{E}(X) = \displaystyle \frac{1}{\lambda} = 10$ (ngày) b) Xác suất sản phẩm này lần đầu tiên được giảm giá một lần nữa, chính xác 10 ngày kể từ ngày hôm nay là: $$\begin{split} \mathbb{P}(9.9 < X < 10.1) &= \displaystyle \int_{9.9}^{10.1} \lambda e^{-\lambda x} dx \\&= (- e^{-\lambda x}) |^{x = 10.1}_{x =9.9} \approx 7.3577 \times 10^ {-3}\end{split}$$ c) Nếu sản phẩm không đươc giảm giá trong 5 ngày tiếp theo, xác suất để nó sẽ giảm giá trong 15 ngày nữa là: $$\begin{split} \mathbb{P}(X \leq 20 | X \geq 5) &= \displaystyle \frac{\mathbb{P}(X \leq 20 \cap X \geq 5)}{\mathbb{P}(X \geq 5)} = \displaystyle \frac{\mathbb{P}(5 \leq X \leq 20)}{\mathbb{P}(X \geq 5)} \\ &= \displaystyle \frac{\displaystyle \int_{5}^{20} \lambda e^{-\lambda x} dx}{\displaystyle \int_{5}^{+\infty} \lambda e^{-\lambda x} dx} = \displaystyle \frac{(-e^{-\lambda x})|_{x =5}^{x=20}}{(-e^{-\lambda x})|_{x=5}^{x=+\infty}} \approx 0.7768698 \end{split}$$ d) Xác suất sản phẩm này được giảm giá lần đầu tiên một lần nữa trong vòng ba ngày hoặc ít hơn là : $$\mathbb{P}(X \leq 3) = \displaystyle \int_{-\infty}^{3}f(x)dx = \displaystyle \int_{0}^{3} \lambda e^{-\lambda x} dx = (-e^{-\lambda x})|_{x = 0}^{x = 3} \approx 0.25918$$ ::: * **==BT Thêm 2.3.3 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn5-14.fna.fbcdn.net/v/t1.15752-9/429106566_260654146981551_3799470821172292528_n.png?_nc_cat=101&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=W4ASwlsi_yUAX_HGDQ8&_nc_ht=scontent.fsgn5-14.fna&oh=03_AdSr4G1CMc3bW1BYUzKa5bmpjww6alfuga4R-Q2MyX-qnw&oe=65FB86AC> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện thời gian giữa hai lượt bảo hành liên tiếp cho các sản phẩm của công ty điện dụng (đơn vị : giờ). $\implies X$ có phân phối mũ với trung bình $\mathbb{E}(X) = \displaystyle \frac{1}{\lambda} = 1.5 \times 24 = 36> 0 \Leftrightarrow \lambda = \displaystyle \frac{1}{36}$ $\implies X \sim Exp(\lambda) = Exp(\displaystyle \frac{1}{36})$ a) Xác suất để không có lượt bảo hành nào trong được tiếp nhận bởi công ty này trong khoảng thời gian 5 giờ nghĩa là xác suất để thời gian giữa hai lượt bảo hành liên tiếp lớn hơn 5 giờ là: $$\begin{split} \mathbb{P}(X \geq 5) &= 1 - \mathbb{P}(X < 5) \\&= 1 - \displaystyle \int_{-\infty}^5(\lambda e^{-\lambda x}) dx \\ &= 1 - (-e^{-\lambda x})|_{x = 0}^{x = 5} \approx 0.87032\end{split}$$ b) Gọi $Y$ là biến ngẫu nhiên rời rạc thể hiện số lượt bảo hành trong khoảng thời gian 5 giờ của công ty đó. $\implies Y$ có phân phối Poisson với $\lambda_p = \displaystyle \frac{5}{36}$ $\implies Y \sim \mathcal{P}(\displaystyle \frac{5}{36})$ Xác suất để công ty này đã tiếp nhận ít nhất $2$ lượt bảo hành trong khoảng thời gian 5 giờ là: $$\begin{split} \mathbb{P}(Y \geq 2) &= 1 - \mathbb{P}(Y < 2) \\ &= 1 - \mathbb{P}(Y = 0) - \mathbb{P}(Y = 1) \\ &= 1 - e^{-\lambda_p}.\displaystyle \frac{\lambda_p^0}{0!} - e^{-\lambda_p}.\displaystyle \frac{\lambda_p^1}{1!} \\ &= 1 - e^{-\frac{5}{36}} - e^{-\frac{5}{36}}.(\displaystyle \frac{5}{36}) \approx 8.79684 \times 10^{-3} \end{split} $$ c) Gọi $Z$ là biến ngẫu nhiên rời rạc thể hiện số lượt bảo hành trong một ngày được chọn để khảo sát. $\implies Z$ có phân phối Poisson với $\lambda_Z = \displaystyle \frac{24}{36} > 0$ $\implies Z \sim \mathcal{P}(\displaystyle \frac{24}{36})$ Xác suất để công ty này đã tiếp nhận không quá 3 luượt bảo hành trong ngày này khi biết rằng công ty này đã tiếp nhận nhiều hơn 1 lượt bảo hành trong ngày này là: $$\begin{split} \mathbb{P}(Z \leq 3 | Z > 1) &= \displaystyle \frac{\mathbb{P}(Z \leq 3 \cap Z > 1)}{\mathbb{P}(Z > 1)} \\ &= \displaystyle \frac{\mathbb{P}(1 < Z \leq 3)}{\mathbb{P}(Z > 1)} \\ &= \displaystyle \frac{\mathbb{P}(Z = 2) + \mathbb{P}(Z = 3)}{ 1- \mathbb{P}(Z = 0) - \mathbb{P}(Z = 1)} \approx 0.9663339 \end{split}$$ ::: ### 4. Phân phối chuẩn - `Normal distribution` #### 4.1. Ôn tập lý thuyết :::info 1. Phân phối chuẩn - `Normal distribution` * Định nghĩa: Cho biến ngẫu nhiên liên tục $X$ được gọi là có phân phối chuẩn, ký hiệu $X \sim \mathcal{N}(\mu, \sigma^2)$, khi hàm mật độ xác suất có dạng, với $-\infty < x < +\infty$: $$\begin{split} f(x) = \displaystyle \frac{1}{\sqrt{2\pi}} . \exp \left\{ - \displaystyle \frac{(x - \mu)^2}{2\sigma^2} \right\} = \displaystyle \frac{1}{\sqrt{2\pi}}.e^{-\frac{(x-\mu)^2}{2\sigma^2}} \end{split}$$ trong đó các hằng số $-\infty < \mu < +\infty$ (có thể viết $\mu \in \mathbb{R})$ và $\sigma > 0$ ::: #### 4.2. Bài tập thực hành * **==Bài tập 2.133==** <center> <img src = https://scontent.fsgn5-14.fna.fbcdn.net/v/t1.15752-9/429761748_1166160267706978_2379374814516907727_n.png?_nc_cat=106&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=uavKlUOaM7QAX8t7Mz4&_nc_ht=scontent.fsgn5-14.fna&oh=03_AdRVZu_84OjBGpWIBfjbYyMyZ47iscuHc9SqVNY4_1hMyw&oe=66037235> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là cường độ nén của các mẫu xi măng (đơn vị: $kg/cm^2$) $\implies X$ có phân phối chuẩn tắc $\implies X \sim N(6000, 100^2)$ * Xác suất để cường độ nén của mẫu nhỏ hơn 6250 $kg/cm^3$ là: $$\mathbb{P}(X < 6250) = \mathbb{P}(\frac{X - 6000}{100} < \frac{6250 - 6000}{100}) = \mathbb{P}(Z < 2.5) = \Phi(2.5) = 0.9938$$ * Xác suất để cường độ nén của mẫu trong khoảng 5800 - 5900 $kg/cm^3$ là: $$\begin{split}\mathbb{P}(5800<X<5900) &=\mathbb{P}(\displaystyle \frac{5800 - 6000}{100} < \displaystyle \frac{X - 6000}{100} < \displaystyle \frac{5900 - 6000}{100}) \\ &= \mathbb{P}(-2 < Z < -1) = \Phi(-1) - \Phi(-2) \\ &= 1 - \Phi(1) - (1 - \Phi(2)) \\ &= 1 - 0.8413 - (1-0.9772) \\ &= 0.1359\end{split}$$ * Để có thể chiếm ít nhất $95\%$ mẫu thì độ nén là: $$\mathbb{P}(X < x) \geq 0.95$$ * Xét $$\begin{split}\mathbb{P}(X < x) = 0.95 &\Leftrightarrow \mathbb{P} (\displaystyle \frac{X - 6000}{100} \leq \displaystyle \frac{x - 6000}{100}) = 0.95 \\ &\Leftrightarrow \mathbb{P}(Z \leq \displaystyle \frac{x - 6000}{100}) = 0.95 \\ &\Leftrightarrow \Phi(\displaystyle \frac{x - 6000}{100}) = 0.95 \\ &\Leftrightarrow \displaystyle \frac{x - 6000}{100} = 1.65 \\ &\Leftrightarrow x = 6165\end{split}$$ * Nhận xét: $x$ tăng thì $\mathbb{P}(X < x)$ tăng nên $\mathbb{P}(X < x) \geq 0.95 \Leftrightarrow x \geq 6165$ Vậy cường độ nén ít nhất 6165 $kg/cm^2$ để có thể chiếm ít nhất $95\%$ mẫu. ::: * **==Bài tập 2.134==** <center> <img src = https://scontent.fsgn5-10.fna.fbcdn.net/v/t1.15752-9/429355001_1522851798260486_5339952571621922417_n.png?_nc_cat=106&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=F6b-8LE1HGwAX8b9LYH&_nc_ht=scontent.fsgn5-10.fna&oh=03_AdTk_KQ7WJTkMjjCtzIP4oKR7BoJMeMO247a94FgylgdWw&oe=6603C423> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện thời gian cho đến khi cần sạc lại pin cho một máy tính xách tay điều kiện bình thường (đơn vị: $phút$) $\implies X$ có phân phối chuẩn với độ trung bình $\mu = 260$ (phút) và độ lệch chuẩn $\sigma = 50$ (phút) $\implies X \sim \mathcal{N}(260, 50^2)$ * Xác suất pin sử dụng kéo dài hơn bốn giờ (240 phút) là: $$\begin{split}\mathbb{P}(X > 240) &= 1 - \mathbb{P}(X \leq 240) \\ &= 1 - \mathbb{P}(\displaystyle \frac{X - 260}{50} \leq \displaystyle \frac{240 - 260}{50}) \\ &= 1 - \Phi(-0.4) = \Phi(0.4) \approx0.6554\end{split}$$ * Xác định thời gian sử dụng pin tại những *giá trị phân vị*, là giá trị của $z$ sao cho xác suất $\mathbb{P}(Z \leq z)$, đạt $25\%$ và $75\%$: * Ta có: $$\mathbb{P}(X \leq x) = \mathbb{P}(\displaystyle \frac{X - 260}{50} \leq \displaystyle \frac{x - 260}{50}) = \Phi(\displaystyle \frac{x - 260}{50})$$ * Ta cần tìm $a$ và $b$ sao cho $\mathbb{P}(X \leq a) = 25\%$ và $\mathbb{P}(X \leq b) = 75\%$: * Đối với $a \geq 0$: $$\begin{split}\mathbb{P}(X \leq a) = 0.25 &\Leftrightarrow \Phi(\displaystyle \frac{a - 260}{50}) = 0.25\\ &\Leftrightarrow \displaystyle \frac{a - 260}{50} = -0.675 \\ &\Leftrightarrow a = 226.25\end{split}$$ $\implies a = 226.5$ (phút) * Đối với $b \geq 0$: $$\begin{split}\mathbb{P}(X \leq b) = 0.75 &\Leftrightarrow \Phi(\displaystyle \frac{b - 260}{50}) = 0.75\\ &\Leftrightarrow \displaystyle \frac{b - 260}{50} = 0.675 \\ &\Leftrightarrow b = 293.75\end{split}$$ $\implies b = 293.75$ (phút) * Xác định thời gian sử dụng pin tương ứng với xác suất ít nhất 0.95 là: * Gọi $c$ $(c > 0)$ là thời gian sử dụng pin tương ứng với ycbt. * Tìm $c > 0$ sao cho $\mathbb{P}(X \geq c) \geq 0.95$ * Ta có: $$\begin{split}\mathbb{P}(X \geq c) &= 1 - \mathbb{P}(X < c) \\ &= 1 - \mathbb{P}(\displaystyle \frac{X - \mu}{\sigma} < \frac{c - \mu}{\sigma}) \\ &= 1 - \Phi(\displaystyle\frac{c - \mu}{\sigma})\end{split}$$ suy ra $$\begin{split}\mathbb{P}(X \geq c) \geq 0.95 &\Leftrightarrow 1 - \Phi(\displaystyle\frac{c - \mu}{\sigma}) \geq 0.95 \\ &\Leftrightarrow \Phi(\displaystyle\frac{c - \mu}{\sigma}) \leq 0.05\\&\Leftrightarrow \displaystyle\frac{c - \mu}{\sigma} \leq \Phi^{-1}(0.05) = -1.645 \\ &\Leftrightarrow c \leq 177.75\end{split}$$ (vì $\Phi$ là hàm đồng biến (hàm tăng)) * Vậy để xác suất sử dụng thời gian pin ít nhất $95\%$ thì cần nhiều nhất $177.75$ phút. ::: * **==Bài tập 2.136==** <center> <img src = https://scontent.fsgn5-12.fna.fbcdn.net/v/t1.15752-9/429630514_710698477933927_4264596067777263563_n.png?_nc_cat=103&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=jtW1g_C8uwsAX_nbis7&_nc_ht=scontent.fsgn5-12.fna&oh=03_AdT15eKb04qUDFOnD_iu2-8khnT58zM09xlZGg5J4zVn-g&oe=6603E369> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện đường kính của một chi tiết máy do một máy tiện tự động sản xuất (đơn vị: $mm$) $\implies X$ có phân phối chuẩn với độ lệch chuẩn $\sigma = 0.05mm$ và độ trung bình $\mu = 50mm$ $\implies X \sim \mathcal{N}(50, 0.05^2)$ * Tỷ lệ sản phẩm đạt yêu cầu tức là `xác suất để một sản phẩm đạt yêu cầu mà "1 chi tiết máy đạt yêu cầu"` $\Leftrightarrow |X - \mathbb{E}(X)| \leq 0.1$. Vậy tỉ lệ để 1 sản phẩm đạt yêu cầu là: $$\begin{split}\mathbb{P}(|X - 50| \leq 0.1) &= \mathbb{P}(49.9 \leq X \leq 50.1) \\ &= \mathbb{P}(\displaystyle \frac{49.9 - 50}{0.05} \leq \displaystyle \frac{X - 50}{0.05} \leq \displaystyle \frac{50.1 - 50}{0.05}) \\ &= \mathbb{P}(-2\leq Z \leq2)\\&= 2\Phi(2) - 1 \approx 0.9544\end{split}$$ * Gọi $Y$ là biến ngẫu nhiên rời rạc thể hiện số sản phẩm đạt yêu cầu trong tổng số 3 sản phẩm lấy ngẫu nhiên. $\implies Y$ có phân phối nhị thức với $n = 3$ và $p =$ `"xác suất để một sản phẩm đạt yêu cầu"` $= 0.9544$ $\implies Y \sim B(3, 0.9544)$ * Xác suất để có ít nhất một sản phẩm đạt yêu cầu là: $$\begin{split}\mathbb{P}(Y \geq 1) &= 1 - \mathbb{P}(Y = 0) \\ &= 1 - C^0_3\times0.9544^0\times(1-0.9544)^3 \approx 0.9999\end{split}$$ ::: * **==Bài tập 2.138==** <center> <img src = https://scontent.fsgn5-10.fna.fbcdn.net/v/t1.15752-9/429606185_757090366369151_6819661826938021695_n.png?_nc_cat=107&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=mnJmYBfnyWMAX95M77f&_nc_ht=scontent.fsgn5-10.fna&oh=03_AdQiNa_ZfCigpEqOEaLgWsJBzi1GNC6B8uJ8fa_qfDeiGg&oe=6603EA4B> </center> :100: ++**==Answer==**++ :::spoiler Gọi $Y$ là biến ngẫu nhiên liên tục thể hiện đường kính của một sợi bán dẫn (đơn vị: $\mu m$) $\implies$ $Y$ có phân phối chuẩn $\implies$ $Y \sim \mathcal{N}(0.5; 0.05^2)$. * Xác suất để đường kính của một sợi lớn hơn $0.62 \mu m$ là: $$\begin{split}\mathbb{P}(X > 0.62) &= 1 - \mathbb{P}(X \leq 0.62) 1 - \mathbb{P}(\displaystyle \frac{X - 0.5}{0.05} \leq \displaystyle \frac{0.62 - 0.5}{0.05}) \\ &= 1 - \mathbb{P}(Z \leq 2.4) \\ &= 1 - \Phi(2.4) \\ &= 1 - 0.9918 \\ &= 8.2 \times 10^{-3}\end{split}$$ * Xác suất để đường kính của một sợi nằm giữa $0.47$ và $0.63 \mu m$ là: $$\begin{split}\mathbb{P}(0.47 < X < 0.63) &= \mathbb{P}(\displaystyle \frac{0.47 - 0.5}{0.05} < \displaystyle \frac{X - 0.5}{0.05} < \displaystyle \frac{0.63 - 0.5}{0.05}) \\ &= \mathbb{P}(-0.6 < Z < 2.6) \\ &= \mathbb{P}(Z < 2.6) - \mathbb{P}(Z \leq -0.6) \\ &= \Phi(2.6) - \Phi(-0.6) \\ &= 0.9953 - (1 - 0.7257) \\ &= 0.721\end{split}$$ * Đường kính sợi của $90\%$ mẫu nhỏ hơn giá trị nào ? * Tìm $x$ thỏa $\mathbb{P}(X < x) = 0.9$ * Ta có: $$\begin{split}\mathbb{P}(X < x) = 0.9 &\Leftrightarrow \mathbb{P}(\displaystyle \frac{X - 0.5}{0.05} < \displaystyle \frac{x - 0.5}{0.05}) = 0.9 \\ &\Leftrightarrow \Phi(\displaystyle \frac{x - 0.5}{0.05}) = 0.9 \\ &\Leftrightarrow \displaystyle \frac{x - 0.5}{0.05} = 1.285 \\ &\Leftrightarrow x = 0.56425\end{split}$$ * Vậy đường kính sợi của $90\%$ mẫu nhỏ hơn 0.56425 $\mu m$. ::: * ==**Bài tập 2.139**== <center> <img src = https://scontent.fsgn2-4.fna.fbcdn.net/v/t1.15752-9/429310787_374330868872986_7579450976642312429_n.png?_nc_cat=101&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=kRXNm017B2EAX9cha2W&_nc_ht=scontent.fsgn2-4.fna&oh=03_AdQWHg3f0GS5PE_N4r8buWsfrLIjAG0-s4_ObJPUXQvU8Q&oe=6603EDD5> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến cố ngẫu nhiên liên tục thể hiện lượng chất lỏng của một máy rót tự động được sử dụng để đổ đầy lon đồ uống có gas (đơn vị: $oz$) $\implies X$ có phân phối chuẩn với giá trị trung bình $\mu = 12.4$ và độ lệch chuẩn $\sigma = 0.1^2$. $\implies X \sim \mathcal{N}(12.4 ; 0.1^2)$ * Xác suất để chất lỏng được rót ít hơn $12 oz$ là: $$\begin{split}\mathbb{P}(X < 12) &= \mathbb{P}(\displaystyle \frac{X - 12.4}{0.1} < \displaystyle \frac{12-12.4}{0.1}) \\ &= \mathbb{P}(Z < -4) \\ &= \Phi(-4) \\ &= 1 - \Phi(4)\\ &= 1 - 0.99997 \\ &= 3 \times 10^{-5}\end{split}$$ * Nếu tất cả các lon nhỏ hơn $12.1$ hoặc lớn hơn $12.6$ bị bỏ đi, tỷ lệ lin bị bỏ đi là: $$\begin{split}\mathbb{P}(X<12.1 \cup X >12.6) &= 1 - \mathbb{P}(12.1 \leq X \leq 12.6) \\ &= 1 - \mathbb{P}(\displaystyle \frac{12.1 - 12.4}{0.1} \leq \displaystyle \frac{X - 12.4}{0.1} \leq \displaystyle \frac{12.6 - 12.4}{0.1}) \\ &= 1 - \mathbb{P}(-3 \leq Z \leq 2) \\ &= 1 - (\Phi(2) - \Phi(-3)) \\ &= 1 - (\Phi(2) - 1 + \Phi(3)) \\ &= 2 - \Phi(2) - \Phi(3) \\ &= 2 - 0.9772 - 0.9987 \\ &= 0.0241\end{split}$$ * Một khoảng đối xứng xung quanh trung bình cho lượng chất lỏng mà $99\%$ số lon có lượng chất lỏng thuộc khoảng đó: * Gọi $a$ là khoảng chênh lệch của khoảng trung bình. * Ta có: $$\begin{split} \mathbb{P}(12.4 - a \leq X \leq 12.4 + a) = 0.99 &\Leftrightarrow \mathbb{P}(X \leq 12.4 + a) - \mathbb{P}(12.4 - a) = 0.99 \\ &\Leftrightarrow \Phi(\displaystyle \frac{12.4 + a - 12.4}{0.1}) - \Phi(\displaystyle \frac{12.4 - a - 12.4}{0.1}) = 0.99 \\ &\Leftrightarrow \Phi(\displaystyle \frac{a}{0.1}) = 0.995 \\ &\Leftrightarrow a = 0.2675\end{split}$$ ::: * ==**Bài tập 2.149**== <center> <img src = https://scontent.fsgn2-7.fna.fbcdn.net/v/t1.15752-9/429302700_369561852593096_7620234344378849142_n.png?_nc_cat=100&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=qi9v-quzgxcAX9eoRNI&_nc_ht=scontent.fsgn2-7.fna&oh=03_AdSzdE0v6WSLQ89zxxCHKjXteiQx4IZPrj6Cqrla8bIcng&oe=66040499> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến cố ngẫu nhiên liên tục thể hiện đường kính của các sợi vải (đơn vị: $mm$) $\implies X$ có phân phối chuẩn với trung bình $\mu = 950mm$ và độ lệch chuẩn $\sigma = 10mm$ $\implies X \sim \mathcal{N}(950, 10^2)$ * Xác suất một sợi vải được chọn ngẫu nhiên có đường kính nằm giữa $947mm$ và $958mm$ là: $$\begin{split}\mathbb{P}(947 < X < 958)&=\mathbb{P}(\displaystyle \frac{947 - 950}{10} < \displaystyle \frac{X - 950}{10} < \displaystyle \frac{958 - 950}{10}) \\ &= \mathbb{P}(-0.3 < Z < 0.8) \\ &= \Phi(0.8) - \Phi(-0.3) \\ &= \Phi(0.8) - (1 - \Phi(0.3)) \\ &= 0.7881 - (1 - 0.6179) \\ &= 0.406\end{split}$$ * Tìm $C$ sao cho $\mathbb{P}(X < C) = 0.8531$, tức là: $$\begin{split} \mathbb{P}(X < C) = 0.8531 &\Leftrightarrow \mathbb{P}(\displaystyle \frac{X - 950}{10} < \displaystyle \frac{C - 950}{10}) = 0.8531 \\ &\Leftrightarrow \mathbb{P}(Z < \displaystyle \frac{C - 950}{10}) = 0.8531 \\ &\Leftrightarrow \Phi(\displaystyle \frac{C - 950}{10}) = 0.8531 \\ &\Leftrightarrow \displaystyle \frac{C - 950}{10} = 1.05 \\ &\Leftrightarrow C = 960.5\end{split}$$ ::: * ==**Bài tập 2.153**== <center> <img src = https://scontent.fsgn2-7.fna.fbcdn.net/v/t1.15752-9/429634790_2122281401485886_1816776961768120900_n.png?_nc_cat=108&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=MH77utZq8VgAX9o_Oqi&_nc_oc=AQnY9C751YJE-Nykg6GsJlsmphfP_x07FVJK6qZFKPm7HYUFIkE8bYStRrW8CCfd5rE&_nc_ht=scontent.fsgn2-7.fna&oh=03_AdRFl8TAA0XMHHNdoqHwaIeiC1_OPiU1mjPpHZv6h6h7Dw&oe=66047C29> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên thể hiện các điểm thi toán SAT và $Y$ là biến ngẫu nhiên thể hiện các điểm thi toán ACT. $\implies X$ có phân phối xấp xỉ chuẩn với độ trung bình $\mu = 480$ và độ lệch chuẩn $\sigma = 100$, $Y$ cũng có phân phối xấp xỉ chuẩn với độ trung bình $\mu = 18$ và độ lệch chuẩn $\sigma = 6$. $\implies X \sim \mathcal{N}(480, 100^2)$ và $Y \sim \mathcal{N}(18, 6^2)$. * Xác suất để sinh viên sẽ có điểm dưới 550 điểm là: $$\begin{split}\mathbb{P}(X < 550) &= \mathbb{P}(\displaystyle \frac{X - 480}{100} < \displaystyle \frac{550 - 480}{100}) \\ &= \mathbb{P}(Z < 0.7) \\ &= \Phi(0.7) \\ &= 0.7580\end{split}$$ Vậy phần trăm sinh viên có điểm dưới 550 trên bài kiểm tra SAT là khoảng $75.80\%$. * Trường kỹ thuật trên nên yêu cầu điểm là bao nhiêu cho bài kiểm tra toán ACT như là một tiêu chuẩn thay thể ? * Gọi $z$ là điểm sàn tối thiểu của bài kiểm tra ACT do trường kỹ thuật cấp. Như vậy ta cần tìm $z$ sao cho $\mathbb{P}(Y < z) = 0.7580$, tức là $$\Phi(\displaystyle \frac{z - 18}{6}) = 0.7580 \Leftrightarrow \displaystyle \frac{z - 18}{6} = 0.7 \Leftrightarrow z = 22.2$$ ::: * ==**BT Thêm 2.2.3 (Supplemental exercises)**== <center> <img src = https://scontent.fsgn2-10.fna.fbcdn.net/v/t1.15752-9/429032724_757969502661238_2049657491626632316_n.png?_nc_cat=109&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=jweF4LEKchIAX8Fr6NC&_nc_ht=scontent.fsgn2-10.fna&oh=03_AdRpYIAOusiYtFaVafyMCDFvkVgdxvc-rCmKFSfbsL1Otg&oe=66048409> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện chiều dài của các trái dưa (đơn vị: $cm$). $\implies X$ có phân phối chuẩn với giá trị trung bình (kỳ vọng) $\mu = 39cm$ và độ lệch chuẩn $\sigma = 2cm$. $\implies X \sim \mathcal{N}(39; 2^2)$ * Tỷ lệ trái dưa có chiều dài vượt qua chiều dài hộp là: $$\begin{split}\mathbb{P}(X > 41) &= 1 - \mathbb{P}(X \leq 41) \\ &= 1 - \mathbb{P}(\displaystyle \frac{X - 39}{2} \leq \displaystyle \frac{41 - 39}{2}) \\ &= 1 - \mathbb{P}(Z \leq 1) \\ &= 1 - \Phi(1) \\ &= 1 - 0.8413 \\ &= 0.1587\end{split}$$ * Vậy tỉ lệ trái dưa có chiều dài vượt quá chiều dài của hộp là khoảng $15.87\%$. * Số dưa phải để lại trong $3500$ trái dưa đã thu hoạch là: $$15.87\% \times 3500 \approx 555.45$$ Vậy số dưa phải để lại khoảng $556$ trái dưa. * Gọi $x$ là chiều dài cần được thiết kế hộp sao cho có thể đựng được $97.5\%$ số trái dưa thu hoạch được (đơn vị: $cm$) * Tìm $x$ thỏa $\mathbb{P}(X \leq x) = 0.975$, tức là $$\Phi(\displaystyle \frac{x - 39}{2}) = 0.975 \Leftrightarrow \displaystyle \frac{x - 39}{2} = 1.96 \Leftrightarrow x = 42.92$$ * Vậy chiều dài cần thiết là $42.92cm$ ::: * **==BT Thêm 2.2.4 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-7.fna.fbcdn.net/v/t1.15752-9/429630517_3645818195691362_9097867859409579943_n.png?_nc_cat=108&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=3hT_Rh1q17EAX8vMCMO&_nc_ht=scontent.fsgn2-7.fna&oh=03_AdR6fw6F5lhPfHjJx5a2qnNk6aiS2VoVdPXu5z3mK_HJ7Q&oe=6604BD99> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện nồng độ cholesterol của một người được lấy ngẫu nhiên (đơn vị: $1$ $mg /$ $100$ $ml$) $\implies X$ có phân phối chuẩn với độ trung bình $\mu = 200$ và độ lệch chuẩn $\sigma = 20$. $\implies X \sim \mathcal(200, 20^2)$ * Xác suất để một người được chọn ngẫu nhiên trong quốc gia đó có mức cholesterol dưới $160$ là: $$\begin{split}\mathbb{P}(X < 160) &= \mathbb{P}(\displaystyle \frac{X - 200}{20} < \displaystyle \frac{160 - 200}{20})\\ &= \mathbb{P}(Z < -2) \\ &= 1 - \Phi(2) \\ &= 1 - 0,9772 \\ &= 0.0228\end{split}$$ * Tỷ lệ dân số có mức cholesterol từ $170$ đến $230$ là: $$\begin{split}\mathbb{P}(170<X<230) &= \mathbb{P}(\displaystyle \frac{170 - 200}{20} < \displaystyle \frac{X - 200}{20} < \displaystyle \frac{230 - 200}{20}) \\ &= \mathbb{P}(-1.5 < Z < 1.5) \\ &= \Phi(1.5) - \Phi(-1.5) \\ &= 2\Phi(1.5) - 1 \\ &= 2 \times 0.9332 - 1 \\&= 0.8664\end{split}$$ * Xác suất để chọn ngẫu nhiên 10 người thì có ít nhất 2 người có mức cholesterol từ $170$ đến $230$ sẽ được tính như sau: * Gọi $Y$ là biến ngẫu nhiên rời rạc thể hiện số lượng người có mức cholesterol từ $170$ đến $230$. $\implies Y$ có phân phối nhị thức với $p =$ `"xác suất một người có mức cholesterol từ 170 đến 230"` $= 0.8664$ và $n = 10$ (vì chọn ngẫu nhiên 10 người) $\implies Y \sim B(10, 0.8664)$ * Xác suất để chọn ngẫu nhiên $10$ người thì có ít nhất $2$ người có mức cholesterol từ $170$ đến $230$ là: $$\begin{split}\mathbb{P}(Y \geq 2) &= 1 - \mathbb{P}(Y < 2)\\ &= 1 - \mathbb{P}(Y = 0) - \mathbb{P}(Y = 1) \\ &= 1 - C^0_{10}\times0.8664^0\times(1-0.8664)^{10} - C^1_{10}\times0.8664^1\times(1-0.8664)^9 \\ &\approx 0.9999998807 \end{split}$$ ::: * **==BT Thêm 2.2.5 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-6.fna.fbcdn.net/v/t1.15752-9/429602356_1429397757965463_7146266876822839117_n.png?_nc_cat=111&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=R-0qp55Lmq8AX-OrU_M&_nc_ht=scontent.fsgn2-6.fna&oh=03_AdSPHvSqlTzY8SllP0FEqOUNuWSbMc8q7O1VjmRPBLKqsg&oe=6604B8AB> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện điện trở thực tế của dây điện được sản xuất bởi công ty A (đơn vị: $ohms$). $\implies X$ có phân phối chuẩn với độ trung bình $\mu = 0.13$ và độ lệch chuẩn $\sigma = 0.01$ $\implies X \sim \mathcal{N}(0.13, 0.01^2)$ * Xác suất để một dây điện được chọn ngẫu nhiên từ sản phẩm công ty A sẽ phù hợp với các đặc điểm kỹ thuật này là: $$\begin{split}\mathbb{P}(0.12<X<0.14) &= \mathbb{P}(\displaystyle \frac{0.12 - 0.13}{0.01} < \displaystyle \frac{X - 0.13}{0.01} < \displaystyle \frac{0.14 - 0.13}{0.01}) \\ &= \mathbb{P}(-1<Z<1) \\ &= 2\Phi(1) - 1 \\ &= 2\times0.8413 - 1 \\&=0.6826\end{split}$$ * Nếu mỗi hệ thống máy tính đều dùng 4 dây điện chọn từ công ty A, xác suất để cả $4$ dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này sẽ được tính như sau: * Gọi $Y$ là biến ngẫu nhiên liên tục thể hiện số dây điện có điện trở phù hợp với đặc điểm kỹ thuật. $\implies Y$ có phân phối nhị thức với $p =$ `"xác suất để một dây điện có điện trở phù hợp với các đặc tính kỹ thuật"` $= 0.6826$ và $n = 4$ $\implies Y \sim B(4, 0.6826)$ * Nếu mỗi hệ thống máy tính đều dùng $4$ dây điện chọn từ công ty A, xác suất để cả $4$ dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này là: $$\begin{split}\mathbb{P}(Y = 4) &= C^4_4\times p^4\times(1-p)^{4-4} \\&= C^4_4\times0.6826^4\times(1-0.6826)^0 \\ &\approx 0.2171\end{split}$$ * Nếu mỗi hệ thống máy tính đều dùng 400 dây điện được chọn từ công ty A, xác suất để có ít nhất 200 dây điện trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật sẽ được tính như sau: * Gọi $W$ là biến ngẫu nhiên thể hiện số dây điện trong một hệ thống được chọn phù hợp đặc điểm kỹ thuật trong tổng số $400$ dây điện được chọn. $\implies W$ có phân phối nhị thức với $m = 400$ và $p =$ `"xác suất để một dây điện có điện trở phù hợp với đặc điểm kỹ thuật"` $= 0.6826$. $\implies W \sim B(400, 0.6826)$ * Lúc này, ta sẽ dùng phép xấp xỉ phân phối nhị thức bằng phân phối chuẩn $\to$ biến ngẫu nhiên $Z = \displaystyle \frac{Y - m \times p}{\sqrt{m\times p\times(1-p)}}$ được xấp xi chuẩn tắc đủ tốt vì: * Xác suất $p = 0.6826$ không quá gần $0$ hoặc $1$, sao cho $0.1 < p <0.9$ * $m \times p \geq 5$ và $m \times p \times (1-p) \geq 5$ $\implies \begin{cases}\mu = \mathbb{E}(W) = m \times p = 400 \times 0.6826 = 273.04 \\ \sigma = \sqrt{Var(W)} = \sqrt{m \times p \times (1 - p)} = \sqrt{400 \times 0.6826 \times (1 - 6826)}\end{cases}$ * Xác suất để có ít nhất 200 dây điện trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này là: $$\begin{split}\mathbb{P}(W \geq 200) &= 1 - \mathbb{P}(W < 200) \\ &= 1 - \mathbb{P}(\displaystyle \frac{W - \mu}{\sigma} < \displaystyle \frac{200 - \mu}{\sigma}) \\ &= 1 - \mathbb{P}(Z < \displaystyle \frac{200 - m \times p}{\sqrt{m \times p \times (1-p)}}) \\ &= 1 - \Phi(\displaystyle \frac{200 - 273.04}{\sqrt{400 \times 0.6826 \times (1 - 6826)}}) \\ &= 1 - \Phi(-7.8459) \\ &= \Phi(7.8459) \\ &\approx 0.99998 \end{split}$$ ::: * **==BT Thêm 2.2.6 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-10.fna.fbcdn.net/v/t1.15752-9/429803815_387929987185540_6776978237183654375_n.png?_nc_cat=109&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=jpE8wDlbIxgAX8ieljQ&_nc_ht=scontent.fsgn2-10.fna&oh=03_AdSlARbLkjJkjjpA7EwnWPAFjuOCjWvhXWZHAXrhuD3ctA&oe=660498A9> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện chiều dài của một con sâu (đơn vị: $cm$) $\implies X$ có phân phối chuẩn với độ trung bình $\mu$ và độ lệch chuẩn $\sigma$ $\implies X \sim \mathcal{N}(\mu, \sigma^2)$ 1. Nếu $\mu = 15cm$ và $\sigma = 3.5cm$ a. Xác suất để chiều dài con sâu ngắn hơn $18.5 cm$ là: $$\begin{split}\mathbb{P}(X < 18.5) &= \mathbb{P}(\displaystyle \frac{X - 15}{3.5} < \displaystyle \frac{18.5 - 15}{3.5}) \\&= \mathbb{P}(Z < 1)\\ &= \Phi(1) \\ &\approx 0.84134\end{split}$$ b. Xác suất để chiều dài con sâu ít nhất $16.75 cm$ là: $$\begin{split}\mathbb{P}(X \geq 16.75) &= 1 - \mathbb{P}(X < 16.75) \\ &= 1 - \mathbb{P}(Z < 0.5) \\ &= 1 - \Phi(0.5) \\ &\approx 1 - 0.6915 \\ &= 0.3085 \end{split}$$ c. Xác suất để chiều dài sâu từ $11.5 cm$ đến $18.5 cm$ là: $$\begin{split}\mathbb{P}(11.5 < X < 18.5) &= \mathbb{P}(\displaystyle \frac{11.5 - 15}{3.5} < \frac{X - 15}{3.5} < \frac{18.5 - 15}{3.5}) \\ &= \mathbb{P}(-1 < Z < 1) \\ &= \Phi(1) - \Phi(-1) \\ &= 2\Phi(1) - 1 \\ &\approx 0.68268\end{split}$$ 2. Tìm trung bình $\mu$ và độ lệch chuẩn $\sigma$ của chiều dài các con sâu. * Giả thiết $30\%$ số sâu dài ít nhất $16cm$, tức là ta có: $$\mathbb{P}(X \geq 16) = 0.3$$ * Tương tự, $15\%$ số sâu ngắn hơn $10cm$, tức là ta có: $$\mathbb{P}(X < 10) = 0.15$$ * Do đó, ta có hệ phương trình sau $$\begin{split}\begin{cases}\mathbb{P}(Z < \displaystyle \frac{16 - \mu}{\sigma}) = 1 - 0.3 = 0.7\\\mathbb{P}(Z < \displaystyle\frac{10 - \mu}{\sigma}) = 0.15\end{cases} &\Leftrightarrow \begin{cases}\Phi(\displaystyle\frac{16 - \mu}{\sigma}) = 0.7 \\ \Phi(\displaystyle\frac{10 - \mu}{\sigma}) = 0.15 \end{cases}\end{split}$$ vì $\Phi$ là hàm đồng biến (hàm tăng) nên ta suy ra $$\begin{split}\begin{cases}\displaystyle\frac{16 - \mu}{\sigma} = \Phi^{-1}(0.7)\\\displaystyle\frac{10 - \mu}{\sigma} = \Phi^{-1}(0.15)\end{cases} &\Leftrightarrow \begin{cases}\mu + \Phi^{-1}(0.7) \times \sigma = 16 \\ \mu + \Phi^{-1}(0.15) \times \sigma = 10\end{cases} \\&\Leftrightarrow \begin{cases}\sigma = \displaystyle\frac{16-10}{\Phi^{-1}(0.7) - \Phi^{-1}(0.15)} \\ \mu = 10 - \sigma \times \Phi^{-1}(0.15)\end{cases} \\ &\Leftrightarrow \begin{cases} \sigma \approx 3.846 \\ \mu \approx 13.981 \end{cases}\end{split}$$ (vì $\Phi^{-1}(0.7) \approx 0.525$ và $\Phi^{-1}(0.15) \approx -1.035$) ::: ### 6. BT về tổng của $m$ biến ngẫu nhiên độc lập và cùng phân phối #### 6.1. Trường hợp $X_1, X_2, ..., X_m$ có cùng phân phối chuẩn :::info * Với biến ngẫu nhiên $X$ có phân phối chuẩn $\mathcal{N}(\mu, \sigma^2)$, với $\sigma > 0$ thì: * Chuẩn tắc hóa cho $X$: $$\displaystyle \frac{X - \mathbb{E}(X)}{\sqrt{Var(X)}} = \displaystyle \frac{X - \mu}{\sigma} = Z \sim \mathcal{N}(0;1)$$ * Cho $X_1, X_2, ..., X_m$ là $m$ biến ngẫu nhiên độc lập và có cùng phân phối chuẩn $\mathcal{N}(\mu, \sigma^2)$. * Đặt $\overline{\rm X} = \displaystyle \frac{X_1 + X_2 + ...+ X_m}{m}$, thì $\overline{\rm X}$ có phân phối chuẩn $\mathcal{N}(\mu, \displaystyle \frac{\sigma^2}{m})$, và ta có kỳ vọng (trung bình) $\mathbb{E}(\overline{\rm X}) = \mu$ và phương sai $Var(\overline{\rm X}) = \displaystyle \frac{\sigma^2}{m}$. ::: * **==BT Thêm 2.4.1 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-5.fna.fbcdn.net/v/t1.15752-9/423221467_353125264376310_8972238898934398181_n.png?_nc_cat=104&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=uWMbMDbKWmEAX_yw4lT&_nc_ht=scontent.fsgn2-5.fna&oh=03_AdTCgpj9WWOz5P9iWv-KUgepOYyXQsp8K2wwsgwnE_bM6Q&oe=66098847> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện trọng lượng một túi rau khi thu hoạch tại một nông trại (đơn vị: $gam$) $\implies X$ có phân phối chuẩn với độ trung bình $\mu = 550 g$ và độ lệch chuẩn $\sigma = 125 g$ $\implies X \sim \mathcal{N}(550;125^2)$ Gọi $X_1, X_2, ..., X_{100}$ lần lượt là $100$ biến ngẫu nhiên liên tục độc lập và có cùng phân phối chuẩn $\mathcal{N}(\mu;\sigma^2) = \mathcal{N}(550;125^2)$ * Đặt $\overline{\rm X} = \displaystyle\frac{X_1 + X_2 + ... + X_{100}}{100}$ $\implies \overline{\rm X}$ có phân phối chuẩn $\mathcal{N}(\mu; \displaystyle\frac{\sigma^2}{100}) = \mathcal{N}(550; 156.25)$ Xác suất để trọng lượng của $100$ túi rau này đạt ít nhất $52000g$ tức là xác suất trung bình để một túi rau đạt ít nhất $520g$ là: $$\begin{split} \mathbb{P}((X_1 + X_2 + ...+X_{100}) \geq 52000)&= \mathbb{P}(\overline{\rm X} \geq \displaystyle\frac{52000}{100}) = \mathbb{P}(\overline{\rm X} \geq 520) \\&= \mathbb{P}(\displaystyle\ \frac{\overline{\rm X} - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}} \geq \displaystyle \frac{520 - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}}) \\&= \mathbb{P}(Z \geq \displaystyle \frac{520 - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}}) \\ &= 1 - \Phi(\displaystyle \frac{520 - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}}) \\ &= 1 - \Phi(-2.4) = \Phi(2.4) \approx0.9918\end{split}$$ ::: * **==BT Thêm 2.4.2 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-8.fna.fbcdn.net/v/t1.15752-9/429703904_1492993678227547_4565970743206650706_n.png?_nc_cat=102&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=GCWIEoUgQhUAX8vJjFn&_nc_ht=scontent.fsgn2-8.fna&oh=03_AdQqFfAXT2tPoLvBaMBgkEappLYyxNgY69SN4qqGLoxffQ&oe=6609EF5E> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X$ là biến ngẫu nhiên liên tục thể hiện đường kính của bu lông được sản xuất (đơn vị: $mm$) $\implies X$ có phân phối chuẩn $\mathcal{N}(\mu; \sigma^2)=\mathcal{N}(4; 0.09)$ $\implies \begin{cases} \mu = 4 \\ \sigma = 0.3 \end{cases}$ Gọi $X_1, X_2, ..., X_{25}$ lần lượt là các biến ngẫu nhiên ngẫu nhiên độc lập thể hiện các đường kình của $m = 25$ bu lông được sản xuất. * Trung bình đường kính của $m = 25$ bu lông này là: $$\overline{\rm X} = \displaystyle \frac{X_1+X_2+...+X_{25}}{m}$$ $\implies \overline{\rm X}$ có phân phối chuẩn $\mathcal{N}(\mu; \displaystyle \frac{\sigma^2}{m}) = \mathcal{N}(4; \displaystyle \frac{9}{2500})$ Xác suất để $25$ bu lông này có trung bình đường kính nằm giữa $3.5mm$ và $4.4mm$ là: $$\begin{split}\mathbb{P}(3.5 < \overline{\rm X} < 4.4) &= \mathbb{P}(\displaystyle \frac{3.5 - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}} < \displaystyle \frac{\overline{\rm X} - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}} < \displaystyle \frac{4.4 - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}}) \\ &= \mathbb{P}(\displaystyle \frac{3.5 - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}} < Z < \displaystyle \frac{4.4 - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}}) \\ &= \Phi(\displaystyle \frac{4.4 - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}}) - \Phi(\displaystyle \frac{3.5 - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}}) \\&= \Phi(\displaystyle \frac{20}{3}) - \Phi(\displaystyle \frac{-25}{3}) \\&= \Phi(\displaystyle \frac{20}{3}) + \Phi(\displaystyle \frac{25}{3}) - 1 \approx 1\end{split}$$ ::: #### 6.2. Trường hợp $X_1, X_2, ..., X_m$ **==++KHÔNG++==** có phân phối chuẩn nhưng ==**$m \geq 30$**== :::info * Trong trường hợp này, ta xét $X_1, X_2, ..., X_m$ có cùng phân phối xác suất nào đó (không nhất thiết là có cùng phân phối chuẩn), tuy nhiên, khi $m \geq 30$ thì ta vẫn có thể dùng phân phối Gauss $\mathcal{N}(0; 1)$ để tính xấp xỉ. * ++**Định lý giới hạn trung tâm (Moivre - Laplace)**++: * Cho các biến ngẫu nhiên $X_1, X_2, ..., X_m$ (với $m \geq 30$) độc lập và có cùng phân phối xác suất nào đó với trung bình là $\mu$ và phương sai $\sigma^2$. * Đặt $\overline{\rm X}= \displaystyle \frac{X_1 + X_2 + ...+ X_m}{m}$. * Khi đó, ta có: kỳ vọng (trung bình) $\mathbb{E}(\overline{\rm X}) = \mu$ và phương sai $Var(\overline{\rm X}) = \displaystyle \frac{\sigma^2}{m}$ và biến ngẫu nhiên $Z = \displaystyle \frac{\overline{\rm X} - \mu}{\displaystyle \frac{\sigma}{\sqrt{m}}}$ có thể tính xấp xỉ bởi phân phối Gauss $\mathcal{N}(0;1)$ ::: * **==BT Thêm 2.4.3 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-6.fna.fbcdn.net/v/t1.15752-9/429715460_404532808929449_2416633277851824418_n.png?_nc_cat=111&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=GIFdUOutsDQAX-sclAQ&_nc_ht=scontent.fsgn2-6.fna&oh=03_AdSYJKkNF91A69GgN3SnQgVJD8ASAyrTA4jf16TimaStPA&oe=660A1696> </center> :100: ++**==Answer==**++ :::spoiler Ta có: $\overline{\rm Y} = \displaystyle \frac{Y_1+Y_2+...+Y_m}{m}$ có phân phối chuẩn với độ trung bình $\mu_{\overline{\rm Y}} = \mu = 10$ và độ lệch chuẩn $\sigma^2_{\overline{\rm Y}} = \displaystyle \frac{\sigma^2}{m}$ $\implies \overline{\rm Y} \sim \mathcal{N}(\mu_{\overline{\rm Y}}; \sigma^2_{\overline{\rm Y}}) = \mathcal{N}(\mu;\displaystyle \frac{\sigma^2}{m}) = \mathcal{N}(10; \displaystyle \frac{49}{36})$ * Xác suất $\mathbb{P}(Y_1+Y_2+...Y_m \leq 288)$ là: $$\begin{split}\mathbb{P}(\displaystyle \frac{Y_1+Y_2+...+Y_m}{m} \leq \displaystyle \frac{288}{m}) &= \mathbb{P}(\overline{\rm Y} \leq 8) \\ &= \mathbb{P}(\displaystyle \frac{\overline{\rm Y} - 10}{\sqrt{\displaystyle \frac{49}{36}}} \leq \displaystyle \frac{-12}{7}) \\ &= \mathbb{P}(Z \leq \displaystyle \frac{-12}{7}) = \Phi(\displaystyle \frac{-12}{7}) \\ &= 1 - \Phi(\displaystyle \frac{12}{7}) \approx 0.04324\end{split}$$ * Xác suất $\mathbb{P}(9 < \overline{\rm Y} < 12.5)$ là: $$\begin{split} \mathbb{P}(\displaystyle \frac{9 - 10}{\sqrt{\displaystyle \frac{49}{36}}} < \displaystyle \frac{\overline{\rm Y} - 10}{\sqrt{\displaystyle \frac{49}{36}}} < \displaystyle \frac{12.5 - 10}{\sqrt{\displaystyle \frac{49}{36}}}) &= \mathbb{P}(\displaystyle \frac{-6}{7} < Z < \displaystyle \frac{15}{7}) \\&= \Phi(\displaystyle \frac{15}{7}) - \Phi(\displaystyle \frac{-6}{7}) \\ &= \Phi(\displaystyle \frac{15}{7}) + \Phi(\displaystyle \frac{6}{7}) - 1 \approx 0.788255\end{split} $$ ::: * **==BT Thêm 2.4.4 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-3.fna.fbcdn.net/v/t1.15752-9/429872511_371208492373633_8057567162991953175_n.png?_nc_cat=107&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=K921PlomIakAX-JE0ic&_nc_ht=scontent.fsgn2-3.fna&oh=03_AdQMdCt4WgjJ1poZW-EXUHG-ewPE_zChnMzdqPd9x4pTIg&oe=660A21F7> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X_1, X_2, ..., X_m$ lần lượt là các biến ngẫu nhiên liên tục thể hiện số tuổi của từng sinh viên một trường đại học trong tổng số $m = 64$ $(m \leq 64)$ sinh viên được chọn ngẫu nhiên. $\implies X_1, X_2,..., X_{64}$ là các biến ngẫu nhiên độc lập và có cùng một phân phối xác suất nào đó với trung bình $\mu = 22.3$ và độ lệch chuẩn $\sigma = 4$, tức là $X_i \sim \mathcal{N}(22.3; 4^2)$ với $i = \overline{\rm 1, 2, ..., 64}$. * Đặt $\overline{\rm X} = \displaystyle \frac{X_1 + X_2 + ... + X_m}{m}$ có phân phối chuẩn với độ trung bình $\mu_{\overline{\rm X}} = \mu = 22.3$ và độ lệch chuẩn $\sigma^2_{\overline{\rm X}} = \displaystyle \frac{\sigma^2}{m} = 0.25$ $\implies \overline{\rm X} \sim \mathcal{N}(22.3;0.25)$ Xác suất tuổi trung bình của các sinh viên này lớn hơn $23$ là: $$\begin{split}\mathbb{P}(\overline{\rm X} > 23) &= 1 - \mathbb{P}(\displaystyle \frac{\overline{\rm X} - 22.3}{\sqrt{0.25}} \leq \displaystyle \frac{23 - 22.3}{\sqrt{0.25}}) \\ &= 1 - \mathbb{P}(Z \leq 1.4) = 1 - \Phi(1.4) \approx 0.0808\end{split}$$ ::: * **==BT Thêm 2.4.5 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-10.fna.fbcdn.net/v/t1.15752-9/429858244_3645725672421714_8931115949930553924_n.png?_nc_cat=109&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=H8V8kfsjkR8AX-5Lc_H&_nc_ht=scontent.fsgn2-10.fna&oh=03_AdQP2VHO_8N8KFszii3XY3Lor2fwPFpmJjHXxp1CbyGowA&oe=660A235A> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X_1, X_2, ..., X_m$ lần lượt là biến ngẫu nhiên liên tục thể hiện các giá trị của các điện trở được sản xuất bởi một nhà máy trong tổng số $m = 50$ điện trở được chọn ngẫu nhiên (đơn vị: $ohm$) Giá trị trung bình của $m = 50$ điện trở được chọn ngẫu nhiên là: $$\overline{\rm X} = \displaystyle \frac{X_1 + X_2 + ... + X_m}{m}$$ có phân phối chuẩn với độ trung bình $\mu_{\overline{\rm X}} = \mu = 100$ (ohm) và độ lệch chuẩn $\sigma^2_{\overline{\rm X}} = \displaystyle \frac{\sigma^2}{m} = \displaystyle \frac{10^2}{50} = 2 \implies \overline{\rm X} \sim \mathcal{N}(\mu_{\overline{\rm X}}; \sigma^2_{\overline{\rm X}}) = \mathcal{N}(100; 2)$ Xác suất giá trị trung bình của $50$ điện trở được chọn ngẫu nhiên nhỏ hơn $95$ ohm là: $$\begin{split}\mathbb{P}(\overline{\rm X} < 95) &= \mathbb{P}(\displaystyle \frac{\overline{\rm X} - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}} < \displaystyle \frac{95 - 100}{\sqrt{2}}) \\&= \Phi(\displaystyle \frac{-5\sqrt{2}}{2}) \\ &= 1 - \Phi(\displaystyle \frac{5\sqrt{2}}{2}) \approx 2.03476 \times 10^{-4}\end{split}$$ ::: * **==BT Thêm 2.4.6 (Supplemental exercises)==** <center> <img src = https://scontent.fsgn2-6.fna.fbcdn.net/v/t1.15752-9/429819008_322783670325395_7641677416072655712_n.png?_nc_cat=110&ccb=1-7&_nc_sid=8cd0a2&_nc_ohc=dfl7uYZoY0QAX_kis15&_nc_ht=scontent.fsgn2-6.fna&oh=03_AdSoMovaUXO654fH1xoDZvYTxJgdpz9rwcGAblcZsJBW5g&oe=660A14EA> </center> :100: ++**==Answer==**++ :::spoiler Gọi $X_1, X_2, ..., X_m$ lần lượt là các biến ngẫu nhiên rời rạc độc lập thể hiện số cuộc gọi của từng đường dây trong tổng số $m = 40$ đường dây tiếp nhận cuộc gọi trong một giờ. $\implies X_1, X_2, ..., X_m$ có phân phối Poisson với tham số $\lambda > 0$ $\implies X_i \sim \mathcal{P}(\lambda) = \mathcal{P}(5)$ với $i = \overline{\rm 1, 2, 3, ..., m}$ và $m = 40$ Giá trị trung bình tổng số cuộc gọi đến $m = 40$ đường dây trong một giờ là: $$\overline{\rm X} = \displaystyle \frac{X_1+X_2+...+X_m}{m}$$ $\implies \overline{\rm X}$ có phân phối chuẩn với độ trung bình $\mu_{\overline{\rm X}} = \mathbb{E}(\overline{\rm X}) = \lambda = 5$ và độ lệch chuẩn $\sigma_{\overline{\rm X}} = \sqrt{Var(\overline{\rm X})} = \sqrt{\displaystyle \frac{\lambda}{m}}$ Xác suất để tổng đài nhận ít nhất $160$ cuộc gọi trong một giờ: $$\begin{split}\mathbb{P}((X_1 + X_2 +...+X_{40}) \geq 160) &= \mathbb{P}(\displaystyle\frac{X_1+X_2+...+X_{40}}{m} \geq \displaystyle \frac{160}{m}) \\ &= 1 - \mathbb{P}(\overline{\rm X} < 4) \\ &= 1 - \mathbb{P}(\displaystyle \frac{\overline{\rm X} - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}} < \displaystyle \frac{4 - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}}) \\ &= 1 - \mathbb{P}(Z < \displaystyle \frac{4 - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}}) \\ &= 1 - \Phi(\displaystyle \frac{4 - \mu_{\overline{\rm X}}}{\sigma_{\overline{\rm X}}}) \\ &= 1 - \Phi(\displaystyle \frac{4 - 5}{\sqrt{\displaystyle \frac{5}{40}}}) \\ & = 1 - \Phi(-2\sqrt{2}) \\ &= \Phi(2\sqrt{2}) \approx 0.9976611324\end{split}$$ ::: --- # Chương 04 : Ước lượng khoảng tin cậy ## I. Ước lượng khoảng cho trung bình (kỳ vọng) * **==Bài tập 4.20==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/431691838_1191140675188693_3097645435037245980_n.png?_nc_cat=106&ccb=1-7&_nc_sid=5f2048&_nc_ohc=P9Fsw2MxXo4AX-SDr90&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdRJHjuFhE6sB8IY5EZIZAsqzs49ziYuXtT2de7CoeS2zw&oe=661E8BD2></center> :::spoiler :100: **Answer** Ta quan tâm tuổi thọ trung bình của bóng đèn sản xuất **a)** Gọi $\mu =$ tuổi thọ trung bình của bóng đèn do công ty này sản xuất. * Độ tin cậy: $1 - \alpha = 96\% \implies \alpha = 4\% = 0.04 \implies \mathcal{z}_{1 -\frac{\alpha}{2}} = \mathcal{z}_{1 - \frac{0.04}{2}} = \mathcal{z}_{0.98} = 2.055$ * Mẫu: * Trung bình mẫu: $\overline{{\bf x}} = 780 \text{ (giờ)}$ * Cỡ mẫu: $n = 30 \text{ (bóng đèn)}$ Theo đề bài, ta có: độ lệch chuẩn $\sigma = 40 \text{ (giờ)}$. Vì phương sai đã biết, $n \geq 30$, X có phân phối chuẩn $\implies$ **TH1:** tính theo phân phối Gauss $\mathcal{N}(0, 1)$ * Sai số khoảng tin cậy (dung sai): $$\epsilon = \mathcal{z}_{1 -\frac{\alpha}{2}} \times \displaystyle \frac{\sigma}{\sqrt{n}} = \mathcal{z}_{0.98} \times \displaystyle \frac{40}{\sqrt{30}} \approx 15.0076$$ Vậy khoảng tin cậy $96\%$ cho tuổi thọ trung bình của bóng đèn do công ty sản xuất là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [764.9924;795.0076]$$ **b)** Tìm $n$ sao cho sai số $\epsilon \leq \epsilon_0 = 10 \text{ (giờ)}$ Ta có: $\epsilon = \mathcal{z}_{1 - \frac{\alpha}{2}} \times \displaystyle \frac{\sigma}{\sqrt{n}} = 2.055 \times \displaystyle \frac{\sigma}{\sqrt{n}}$ Nếu $\epsilon \leq 10 \Leftrightarrow 2.055 \times \displaystyle \frac{40}{\sqrt{n}} \leq 10 \Leftrightarrow n \geq 67.5684$ Vậy phải quan sát ít nhất $68$ bóng đèn nếu muốn sai số ước lượng không quá $10$ giờ. ::: * ==**Bài tập 4.21**== <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432351215_7629157023774640_3706110309034691420_n.png?_nc_cat=100&ccb=1-7&_nc_sid=5f2048&_nc_ohc=jfUZP1ftiWoAX8qdEII&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdQs9CtX_RjmfyJwC-qTe_XzKAlCnjjM2R7q4xK3V12oKA&oe=661F3950></center> :::spoiler :100: **Answer** Ta quan tâm đường kính của các ống kim loại trong một mẫu cho trước. Gọi $\mu =$ đường kính trung bình của ống kim loại được sản xuất từ máy này. * Độ tin cậy: $1 - \alpha = 99\% \implies \alpha = 0.01$ * Lấy mẫu: * Cỡ mẫu: $n = 9$ (ống kim loại) * Trung bình mẫu: $$\overline{{\bf x}} =\displaystyle \frac{1}{9} \times \displaystyle \sum_{i = 1}^9{\bf x_i} \approx 1.0056$$ * Phương sai mẫu: $${\bf s^2} = \displaystyle \frac{1}{9 - 1} \times \displaystyle \sum_{i = 1}^{9}({\bf x_i} - \overline{{\bf x}})^2 \approx 6.0278 \times 10^{-4}$$ * Độ lệch chuẩn mẫu: ${\bf s} = \sqrt{{\bf s^2}} \approx 0.02455$ Theo đề bài, ta có: phương sai $\sigma^2$ không biết, cỡ mẫu $n = 9 < 30$ (mẫu nhỏ) $\implies$ **TH3:** tính theo phân phối t-Student $(n - 1) \sim \text{T(8)}$ * Sai số khoảng tin cậy (dung sai ước lượng): $$\epsilon = \displaystyle t^{n - 1}_{1 - \frac{\alpha}{2}} \times \displaystyle \frac{s}{\sqrt{n}} \approx \displaystyle t^{8}_{0.995} \times \displaystyle \frac{0.02455}{\sqrt{9}} \approx 0.02746$$ Vậy khoảng tin cậy $99\%$ cho đường kính trung bình của ống kim loại được sản xuất từ máy là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [0.97814 ; 1.03306]$$ ::: * **==Bài tập 4.23==** <center><img src =https://scontent.xx.fbcdn.net/v/t1.15752-9/432263916_1456100168620240_8125727196220469610_n.png?_nc_cat=100&ccb=1-7&_nc_sid=5f2048&_nc_ohc=2L9Rt_epmpIAX9WJK40&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdTHYiCycx8gYcItRXHdQvrb5LkYS8Qrsf--W488cBzTtQ&oe=661F2F81></center> :::spoiler :100: **Answer** Ta quan tâm về năng lượng của một thanh chocolate mang lại. Gọi $X$ là biến ngẫu nhiên thể hiện năng lượng của thanh chocolate $\implies X \sim \mathcal{N}(\mu, \sigma^2)$ Gọi $\mu =$ số calo năng lượng trung bình thực sự của thanh chocolate từ thương hiệu này. * Độ tin cậy: $1 - \alpha = 0.99 \implies \alpha = 0.01 \implies \mathcal{z}_{1 - \frac{\alpha}{2}} = \mathcal{z}_{0.995} = 2.575$ * Lấy mẫu: * Trung bình mẫu: $\overline{{\bf x}} = 230$ (calo) * Cỡ mẫu: $n = 10$ Theo đề bài, ta có: độ lệch chuẩn $\sigma = 15 \text{ (calo)}$. Vì phương sai $\sigma^2$ đã biết, cỡ mẫu $n = 10 < 30$, $X$ có phân phối chuẩn $\implies$ **TH1:** tính theo phân phối Gauss $\mathcal{N}(0, 1)$ * Sai số khoảng tin cậy (dung sai ước lượng): $$\epsilon = \mathcal{z}_{1 - \frac{\alpha}{2}} \times \displaystyle \frac{\sigma}{\sqrt{n}} \approx 2.575 \times \displaystyle \frac{15}{\sqrt{10}} \approx 12.2143$$ Vậy khoảng tin cậy $99\%$ cho con số calo trung bình thực sự của thương hiệu này là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [217.7875 ; 242,2143] $$ ::: * **==Bài tập 4.28==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/431702049_1462392874708674_2644023463567069970_n.png?_nc_cat=105&ccb=1-7&_nc_sid=5f2048&_nc_ohc=_KxII0zme8QAX_EQhxF&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdRVDMgPQcEvq3M0AcWNWXkY1zEELmyNFJSBmLh1LYpxLg&oe=661FB896></center> :::spoiler :100: **Answer** Ta quan tâm đến cường độ nén của bê tông được thử nghiệm bởi một kỹ sư dân dụng. Gọi $X$ là biến ngẫu nhiên thể hiện cường độ nén của bê tông. $\implies X$ có phân phối chuẩn $\implies X \sim \mathcal{N}(\mu, \sigma^2)$ Gọi $\mu =$ cường độ nén trung bình của khối bê tông * Độ tin cậy: $1 - \alpha = 0.95 \implies \alpha = 0.05$ * Lấy mẫu: * Cỡ mẫu: $n = 12$ * Trung bình mẫu: $$\overline{{\bf x}} = \displaystyle \frac{1}{12} \times \displaystyle \sum_{i = 1}^{12}{\bf x_i} \approx 2259.9167$$ * Phương sai mẫu: $${\bf s}^2 = \displaystyle \frac{1}{12 - 1} \times \displaystyle \sum_{i = 1}^{12}({\bf x_i} - \overline{{\bf x}})^2 \approx 1265.1742$$ * Độ lệch chuẩn mẫu: ${\bf s} = \sqrt{{\bf s^2}} \approx 35.5693$ Theo đề bài, ta có: phương sai $\sigma^2$ chưa biết, cỡ mẫu $n = 12 < 30$, $X$ có phân phối chuẩn $\implies$ **TH3:** tính theo phân phối t-Student $(n - 1) \sim \text{T}(11)$ * Sai số khoảng tin cậy (dung sai ước lượng): $$\epsilon = \displaystyle t^{11}_{0.975} \times \displaystyle \frac{{\bf s}}{\sqrt{n}} \approx 2.2010 \times \displaystyle \frac{35.5693}{\sqrt{12}} \approx 22.5998$$ Vậy khoảng tin cậy $95\%$ cho cường độ nén trung bình là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [2237.9167 ; 2282.5165]$$ ::: * **==BT thêm 4.1.1 (Supplemental exercises)==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432480253_426842289904267_107532705152173003_n.png?_nc_cat=107&ccb=1-7&_nc_sid=5f2048&_nc_ohc=q84oPG5hF4IAX_MHGHm&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdS1Tn9vBNDksTbrMDAiG5h7lMT71FLfMP-BEoUZYg2nzg&oe=661FC627></center> :::spoiler :100: **Answer** Ta quan tâm về tốc độc cháy của một hệ thống tên lửa phản lực. Gọi $X$ là biến ngẫu nhiên thể hiện tốc độ cháy của hệ thống tên lửa (đơn vị: $cm/s$) $\implies X$ có phân phối chuẩn $\implies X \sim \mathcal{N}(\mu, \sigma^2)$ Gọi $\mu =$ tốc độ cháy trung bình của thanh nhiên liệu * Độ tin cậy: $1 - \alpha = 0.95 \implies \alpha = 0.05 \implies \mathcal{z}_{0.975} = 1.96$ * Mẫu: * Cỡ mẫu: $n = 25$ * Trung bình mẫu: $\overline{{\bf x}} = 51.3 \text{ cm/s}$ Theo đề bài, ta có: độ lệch chuẩn $\sigma = 2 \text{ cm /s}$. Vì phương sai $\sigma^2$ đã biết, cỡ mẫu $n = 25 < 30$, $X$ có phân phối chuẩn $\implies$ **TH1:** tính theo phân phối Gauss $\mathcal{N}(0,1)$ * Sai số khoảng tin cậy (dung sai ước lượng): $$\epsilon = \mathcal{z}_{0.975} \times \displaystyle \frac{2}{\sqrt{25}} \approx 0.784$$ Vậy khoảng tin cậy $95\%$ cho tốc độ cháy trung bình của thanh nhiên liệu là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [50.516 ; 52.084]$$ ::: * **==Bài tập 4.47==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432240916_1125084618623863_2112930051751429721_n.png?_nc_cat=101&ccb=1-7&_nc_sid=5f2048&_nc_ohc=g83wO054xtUAX8g26Ug&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdTI69AzsWNqKdB-EzcF2WyHroIn2pGPoDUxbJqt0O5TUQ&oe=661FE513></center> :::spoiler :100: **Answer** Gọi $X$ là trọng lượng trái cây (đơn vị: g) | $N$ | $X$ | $X^2$ | |:-------------------------------:|:-------------------------------------------:|:-----------------------------------------------:| | $12$ | $12 \times 205$ | $12 \times 205^2$ | | $17$ | $17 \times 215$ | $17 \times 215^2$ | | $20$ | $20 \times 225$ | $20 \times 225^2$ | | $18$ | $18 \times 235$ | $18 \times 235^2$ | | $15$ | $15 \times 245$ | $15 \times 245^2$ | | $n = 12 + 17 + \dots + 15 = 82$ | $\displaystyle \sum_{n}^{i = 1}x_i = 18520$ | $\displaystyle \sum_{n}^{i = 1}x_i^2 = 4197050$ | a) Ta có: $n = 82$ $\overline{{\bf x}} = \displaystyle \frac{1}{n}\displaystyle \sum_{i = 1}^{n}x_i = \displaystyle \frac{1}{82} \times 18520 \approx 225.85$ ${\bf s^2} = \displaystyle \frac{\displaystyle \sum_{i = 1}^{n}x_i^2 - \displaystyle \frac{(\displaystyle \sum_{i = 1}^{n}x_i)^2}{n}}{n - 1} = \displaystyle \frac{4197050 - \displaystyle \frac{18520^2}{82}}{82 - 1} \approx 175.81$ $\implies {\bf s} \approx 13.26$ Ví phương sai $\sigma^2$ chưa biết, mẫu lớn $\implies$ **TH2:** tính theo phân phối Gauss $\mathcal{N}(0, 1)$ * **Tìm khoảng tin cậy $95\%$** * Độ tin cậy: $1 - \alpha = 0.95 \implies \alpha = 0.05 \implies \mathcal{z}_{0.975} = 1.96$ * Sai số KTC (dung sai ước lượng): $$\epsilon = \mathcal{z}_{0.975} \times \displaystyle \frac{{\bf s}}{\sqrt{n}} \approx 1.96 \times \displaystyle \frac{13.26}{\sqrt{82}} \approx 2.87$$ Vậy khoảng tin cậy $95\%$ cho trọng lượng trung bình của trái cây là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [222.9799 ; 228.7201]$$ * **Tìm khoảng tin cậy $99\%$** * Làm tương tự câu trên ta có: $\mu \in [222.0867;229.6133]$ b) Độ tin cậy $99\% \implies \alpha = 0.01 \implies \mathcal{z}_{0.995} = 2.57$ Tìm $n$ sao cho $\epsilon \leq \epsilon_0 = 2$ (g): $$\epsilon = \mathcal{z}_{1 - \frac{\alpha}{2}} \times \displaystyle \frac{{\bf s}}{\sqrt{n}} \leq 2 \implies n \geq 290.33$$ Vậy cần phải quan sát ít nhất $291$ trái. ::: * **==Bài tập 4.48==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432291355_1441344353170147_3966464088113131701_n.png?_nc_cat=107&ccb=1-7&_nc_sid=5f2048&_nc_ohc=X512arzP9ZQAX-Voo2M&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdRgQBOfvt-1S5jZqb_7liPsL3qk0ox2MY49_71LVYcK-g&oe=661FE100></center> :::spoiler :100: **Answer** Ta quan tâm về nồng độ đo ion **Na$^+$** trên một số người. a) Gọi $\mu =$ nồng độ ion **Na$^+$** trung bình của một số người (trung bình tổng thể). * Mẫu: * Cỡ mẫu: $n = 12$ * Trung bình mẫu: $$\overline{{\bf x}} = \displaystyle \frac{1}{n} \times \displaystyle \sum_{i = 1}^{n}{\bf x_i} \approx 137.8333$$ * Phương sai mẫu: $${\bf s^2} = \displaystyle \frac{1}{n - 1} \times \sum_{i = 1}^{n}({\bf x_i} - \overline{{\bf x}})^2 \approx 19.42424$$ * Độ lệch chuẩn mẫu: ${\bf s} = \sqrt{{\bf s^2}} \approx 4.4073$ b) Độ tin cây: $1 - \alpha = 0.95 \implies \alpha = 0.05$ Vì phương sai tổng thể $\sigma^2$ chưa biết, cỡ mẫu $n = 12 < 30$, biến ngẫu nhiên liên tục thể hiện phân phối chuẩn $\implies$ **TH3:** tính theo phân phối t - Student $(n - 1) \sim \text{T}(11)$ * Sai số KTC (dung sai ước lượng): $$\epsilon = \displaystyle t_{1 - \frac{\alpha}{2}}^{n - 1} \times \displaystyle \frac{s}{\sqrt{n}} \approx 2.8003$$ Vậy khoảng tin cậy $95\%$ (ước lượng trung bình) cho nồng độ ion Na$^+$ trung bình là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [135.033 ; 140.6336]$$ ::: * **==Bài tập 4.49==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432299568_696177349127182_4300529913749556832_n.png?_nc_cat=106&ccb=1-7&_nc_sid=5f2048&_nc_ohc=CXp95f8RgkoAX8L12yy&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdTI5UNWtaqOAvtJmMsEytct0i0pw8A7uXo_k7j7MZdCQA&oe=662050A2></center> :::spoiler :100: **Answer** Ta quan tâm đến tuổi thọ $X$ giờ của một số bóng đèn do xí nghiệp A sản xuất (đơn vị: giờ) a) Gọi $\mu =$ tuổi thọ trung bình của một bóng đèn | $N$ | $X$ | $X^2$ | |:---------:|:--------------------------------------------------:|:-------------------------------------------------------:| | $10$ | $10 \times 1000$ | $10 \times 1000^2$ | | $14$ | $14 \times 1100$ | $14 \times 1100^2$ | | $16$ | $16 \times 1200$ | $16 \times 1200^2$ | | $17$ | $17 \times 1300$ | $17 \times 1300^2$ | | $18$ | $18 \times 1400$ | $18 \times 1400^2$ | | $16$ | $16 \times 1500$ | $16 \times 1500^2$ | | $16$ | $16 \times 1600$ | $16 \times 1600^2$ | | $12$ | $12 \times 1700$ | $12 \times 1700^2$ | | $9$ | $9 \times 1800$ | $9 \times 1800^2$ | | $n = 128$ | $\displaystyle \sum_{i = 1}^{n}{\bf x_i} = 178100$ | $\displaystyle \sum_{i = 1}^{n}{\bf x_i^2} = 254790000$ | * Mẫu: * Cỡ mẫu: $n = 128$ * Trung bình mẫu: $\overline{\bf x} = \displaystyle \frac{1}{n}\times \displaystyle \sum_{i = 1}^{n}{\bf x_i} = \displaystyle \frac{1}{128} \times 178100 \approx 1391.41$ * Phương sai mẫu: $${\bf s^2} = \displaystyle \frac{1}{n - 1} \times \displaystyle \sum_{i = 1}^{n}n_i({\bf x_i} - \overline{{\bf x}})^2 \approx 54964.94$$ * Độ lệch chuẩn mẫu: ${\bf s} = \sqrt{{\bf s^2}} \approx 234.45$ b) Phương sai $\sigma^2$ chưa biết, cỡ mẫu lớn $n = 128 > 30$ $\implies$ **TH2:** tính theo phân phối chuẩn Gauss $\mathcal{N}(0;1)$ * Độ tin cậy: $1 - \alpha = 0.95 \implies \alpha = 0.05 \implies \mathcal{z}_{1 - \frac{\alpha}{2}} = \mathcal{z}_{0.975} = 1.96$ * Sai số KTC (dung sai ước lượng): $$\epsilon = \mathcal{z}_{0.975} \times \displaystyle \frac{{\bf s}}{\sqrt{n}} \approx 1.96 \times \displaystyle \frac{234.45}{\sqrt{128}} \approx 40.6164$$ Vậy khoảng tin cậy $95\%$ cho ước lượng tuổi thọ trung bình của bóng đèn là: $$\overline{{\bf x}} - \epsilon \leq \mu \leq \overline{{\bf x}} + \epsilon \Leftrightarrow \mu \in [1350.7936 ; 1432.0264]$$ c) Tìm $n$ sao cho $\epsilon \leq \epsilon_0 = 30 \Leftrightarrow \mathcal{z}_{0.975} \times \displaystyle \frac{{\bf s}}{\sqrt{n}} \leq 30 \implies n \leq 234.6227$ Vậy quan sát ít nhất $235$ bóng đèn. ::: * **==Bài tập 4.50==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432299575_1139323587423465_4584482164099728997_n.png?_nc_cat=105&ccb=1-7&_nc_sid=5f2048&_nc_ohc=1KUu8c3QE5UAX_T9fpC&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdRIOw12kiP116hSr1HLbBvRZXr8tXT1pBRXsiMmUq-uCg&oe=6620645B></center> :::spoiler :100: **Answer** ::: ## II. Ước lượng khoảng cho tỷ lệ * **==Bài tập 4.54==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/431744991_934630804921704_3198067457416660145_n.png?_nc_cat=101&ccb=1-7&_nc_sid=5f2048&_nc_ohc=Ce3Ok41QCeoAX8LvxBU&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdTY0hwMeiqPelf99SudMBy74T4sNkZO9dlhmoJUc4ByXA&oe=662060AC></center> :::spoiler :100: **Answer** ::: * **==BT thêm 4.1.2 (Supplemental exercises)==** <center><img src = https://scontent.xx.fbcdn.net/v/t1.15752-9/432484015_431717376063500_3186907446055883690_n.png?_nc_cat=100&ccb=1-7&_nc_sid=5f2048&_nc_ohc=4nbSIJibnBUAX-xFuk0&_nc_ad=z-m&_nc_cid=0&_nc_ht=scontent.xx&oh=03_AdTm5JgH83WWD6MAooA7wQKcgnlJM9a7Nws9qECXqYZNhg&oe=662053F7></center> :::spoiler :100: **Answer** ::: --- # Chương 05: Kiểm định giả thuyết thống kê ##