# Các nội dung bài tập môn XSTK
## Phần 4: Kiểm định giả thiết thống kê
### Chuyên đề 1: Kiểm định giả thiết về giá trị trung bình
#### Bài tập mẫu
##### Bài 1
:::info
Trọng lượng các bao gạo là biến ngẫu nhiên chuẩn $N(0;\ 0,01)$, đơn vị: kg. Có nhiều ý kiến của khách hàng phản ánh là trọng lượng bị thiếu. Một tổ thanh tra đã cân ngẫu nhiên 25 bao gạo từ lô hàng bị nghi ngờ. Kết quả nhận được như sau:
| Trọng lượng<br />bao gạo X | < 48,5 | [48,5; 49) | [49; 49,5) | [49,5; 50) | [50; 50,5) |
| - | - | - | - | - | - |
| Số bao | 2 | 5 | 10 | 6 | 2 |
Coi như độ tản mát của các bao gạo ở lô này vẫn như mức quy định. Từ số liệu trên có thể kết luận gì về ý kiến nghi ngờ của khách hàng (xét với mức ý nghĩa $\alpha = 0,05$)?
:::
:::success
:::spoiler :key: **Lời giải**
Ở đây bài toán quan tâm tới trọng lượng trung bình $EX$ của lô hàng bị khách hàng phản ánh. Theo ý kiến khách hàng thì chúng ta cẩn kiểm tra giả thiết $EX < 50$. Giả thiết còn lại của bài toán đương nhiên là $EX = 50$.
Vậy $H: EX = 50$; $K: EX < 50$; $\alpha = 0,05$
Theo giả thiết thì lô hàng này có $DX = 0,01$; đã biết $X$ tuân theo luật chuẩn, nên ta dùng trường hợp a) với miền tiêu chuẩn $S_3$. Từ mẫu đã cho ta tính:
$\overline X = 49,27$
$u = \frac{49,97 - 50}{\frac{0,1}{5}} = - 36,5$
$u(0,05) = 1,65$
$- 36,5 < - 1,65$ tức là miền $S_3$ xảy ra, nên ta bác bỏ giả thiết $EX = 50$ và chấp nhận đối thiết $EX < 50$; nghĩa là ý kiến khách hàng phản ánh là có cơ sở.
:::spoiler **Xem thêm**
Để minh hoạ chúng ta xét thêm hai bài toán:
$EX = 50 / EX \neq 50$ ; $EX = 50 / EX > 50$ với cùng mức ý nghĩa $0,05$.
Ta có $u(0,028) = 1,96$
Vậy:
$|-36,5| > 1,96 \Rightarrow$ miền $S_1$ xảy ra $\Rightarrow$ Bác bỏ $EX = 50$, chấp nhận $EX \neq 50$. Kết luận này phù hợp với kết luận trước, nhưng kết luận trước cho nhiều thông tin hơn, cho nên giá trị hơn.
$-36,5 < 1,65 \Rightarrow$ miền $\overline S_2$ xảy ra $\Rightarrow$ Ta chấp nhận $EX = 50$, bác bỏ $EX > 50$. So sánh với hai kết luận trước thì trái ngược hẳn lại. Vậy có mâu thuẫn không?
Sự trái ngược này là hoàn toàn lôgic, bởi vì ước lượng điểm cho $EX$ là $49,27$. Ước lượng điểm $< 50$, nhưng giá trị thực $EX$ có thể $= 50$. Bài toán $EX=50 / EX < 50$ đã kết luận $EX < 50$. Trong ba tình huống $EX < 50$; $EX = 50$; $EX > 50$ thì $EX < 50$ là tình huống đúng. Bài toán ta xét sau cùng là xét giữa hai tình huống sai và yêu cầu phải chọn lấy một, cho nên chúng ta phải chọn $EX = 50$, vì chọn như thế đỡ sai hơn.
:::
##### Bài 2
:::info
Trong điều kiện chăn nuôi bình thường, lượng sữa trung bình của một con bò là 14 kg/ngày. Cải tiến chế độ chăn nuôi đã cho lượng sữa nhiều lên. Để có thông tin người ta đã điều tra ngẫu nhiên 40 con bò và tính được lượng sữa trung bình/ngày của một con bò là 18 kg và độ lệch tiêu chuẩn $s=2,5kg$. Với mức ý nghĩa $\alpha = 0,10$ thử xem lượng sữa trung bình của bò có tăng thực hay không? Cho biết lượng sữa/ngày của một con bò là bnn chuẩn.
:::
:::success
:::spoiler :key: **Lời giải**
Theo bài ra thì một tình huống cần xem xét là $EX > 14$, cho nên:
$H: EX = 14$; $K: EX > 14$; $\alpha = 0,10$. $DX$ chưa biết, nhưng $X$ chuẩn. Ta có:
$t = \frac{18-14}{\frac{2,5}{\sqrt{39}}} = 9,992$
Tra bảng $t_{39}(0,10) = 1,28$
$9,992 > 1,28 \Rightarrow$ miền $S_2$ xảy ra — Bác bỏ $EX = 14$, chấp nhận $EX > 14$. Lượng sữa đã tăng lên thực sự.
:::
##### Bài 3
:::info
Gọi X là độ bền của một loại dây thép. Trước khi thay đổi công nghệ thì $EX = 165$; độ lệch tiêu chuẩn $\sigma = 15$. Với công nghệ mới người ta lấy ngẫu nhiên ra 25 sợi dây, đo độ bền của chúng ta được $\overline X = 170$. Coi như độ tản mát của các giá trị của độ bền X trong lô sản phẩm mới vẫn như trước, tức là $DX = 15^2$. Giả thiết $X$ có phân phối chuẩn.
a) Với mức ý nghĩa $\alpha = 0,10$ miền tiêu chuẩn của bài toán $H: EX = 165 / K: EX > 165$ sẽ là miền nào?
b) Miền $\{\overline X > 167\}$ sẽ có mức ý nghĩa là bao nhiêu?
c) Nếu lấy một giá trị cụ thể trong miền đối thiết $K$, chẳng hạn giá trị $171$. Hãy tính xác suất phạm sai lầm loại II ($\beta$) và lực lượng $1 - \beta$ tương ứng đối với bài toán nêu trong a) và trong b).
:::
:::success
:::spoiler :key: **Lời giải**
$X$ chuẩn với $DX$ đã biết.
Khi đó $X \cong N(\mu;\ \frac{15^2}{25}) = N(\mu;\ 9)$
a) Theo miền $S_2 = \{\frac{\overline X - 165}3 \geq u(0,10) \}$
$=\{\overline X \geq 165 + 3.1,28 \}$
$=\{\overline X \geq 168,84\}$
Như vậy với $\overline X = 170$ thì chúng ta bác bỏ giả thiết $EX = 165$, chấp nhận $EX > 165$
b) Nếu $H$ đúng thì $\overline X \cong N(165;\ 9)$, cho nên:
$P(\overline X > 167 \mid H)$ $= P(\frac{\overline X - 165}3 > \frac{167-165}3)$
$= 1 - \Phi(\frac23) = 1 - 0,7486 = 0,2514$
Vậy xác suất bác bỏ $H$ khi $H$ đúng hay xác suất phạm sai lầm loại I là $0,2614 \sim 0,25$
c) Nếu xét với giá trị cụ thể của đối thiết $\mu = 171$, khi đó xác suất phạm sai lầm loại II sẽ là:
$\beta = P\{(\overline X < 168,84) \mid (\mu=171)\}$
$=P\{\frac{X - 171}3 < \frac{168,84- 171}3\}$
$=\Phi(-0,72)$ $=0,2358\ (\overline X \cong N(171;\ 9))$
Do đó lực lượng $1 - \beta = 0,7642$
Với miền $\{\overline X > 167 \}$ thì:
$\beta = \Phi(\frac{167-171}3) = \Phi(-1,33) = 0,0918$
Lực lượng $1 - \beta = 0,9082$
:::
### Chuyên đề 2: Kiểm định một tỷ lệ (hay xác suất)
#### Bài tập mẫu
:::info
Một máy sản xuất tự động với tỷ lệ chính phẩm 98%. Sau một thời gian làm việc, người ta kiểm tra ngẫu nhiên 500 sản phẩm do máy này chế tạo, thấy có 28 phế phẩm. Với mức ý nghĩa $\alpha = 0,05$ hãy thử xem chất lượng làm việc của máy có còn được như trước hay không? Nếu đã thay đổi thì tăng hay giảm?
:::
:::success
:::spoiler :key: **Lời giải**
Đề đánh giá chất lượng của máy chúng ta dùng tỷ lệ chính phẩm $p$ (hoặc tỷ lệ phế phẩm). Theo để bài thì giả thiết mà chúng ta cần xem xét là $p \neq 0,98$. Do đó:
$H: p = 0,98\ /\ K: p \neq 0,98$, $\alpha = 0,05$. Ta có:
$p^* = \frac{472}{500} = 0,944$
$u = \frac{0,944 - 0,98}{\sqrt{0,98.0,02}}\sqrt{500} = -5,75$
$u(0,025) = 1,96$
$5,75 > 1,96 \Rightarrow$ miển $S_1$ xảy ra $\Rightarrow$ Bác bỏ $p = 0,98$; chấp nhận $p \neq 0,98$.
Như vậy tỷ lệ chính phẩm đã thay đổi so với trước. Ướcvlượng điểm cho $p$ là $0,944$, nhỏ hơn $0,98$; cho nên chúng ta chọn tình huống $p < 0,98$ để kiểm tra. Vậy
$H: p = 0,98\ /\ p < 0,98$; $\alpha = 0,05$
$u(0,05) = 1,65$
$-5,75 < -1,65 \Rightarrow$ miền $S_3$ xảy ra $\Rightarrow$ Chấp nhận $p < 0,98$; tức là tỷ lệ chính phẩm đã giảm so với trước.
:::
### Chuyên đề 3: Kiểm định một phương sai
#### Bài tập mẫu
:::info
Người ta thử độ chịu lực của 20 ổ khoá loại MK thì thấy độ lệch tiêu chuẩn mẫu s = 3,2 pao (1 pao xấp xỉ 450 gam). Nhà máy khẳng định rằng độ lệch tiêu chuẩn thực là 3 pao. Với mức ý nghĩa $\alpha = 0,10$ từ số liệu mẫu trên có thể chấp nhận khẳng định của nhà máy không. Giả thiết độ chịu lực X của khoá tuân theo luật chuẩn.
:::
:::success
:::spoiler :key: **Lời giải**
Theo bài ra thì ta cần chọn đối thiết $DX \neq 3^2$. Do đó:
$H: DX=9\ /\ K: DX \neq 9$, $\alpha= 0,10$
Tra bảng phân phối $\chi^2$ ta được:
$\chi_{19}^2(0,95) = 10,1$; $\chi_{19}^2(0,05) = 30,1$
$\frac{ns^2}{\sigma_0^2} = \frac{20.3,2^2}{9} = 22,756$
Ta có $10,1 < 22,756 < 30,1$ $\Rightarrow$ $\overline {S_1}$ xảy ra $\Rightarrow$ Chấp nhận $H$, tức là $DX = 9$. Khẳng định của nhà máy là có cơ sở.
:::
### Bài tập tự luyện
#### Bài 1
:::info
Đối với người Việt Nam lượng huyết sắc tố trung bình là $138,3g/l$. Khám cho 80 công nhân ở nhà máy có tiếp xúc hoá chất thấy huyết sắc tố trung bình là $120g/l$; $s = 15g/l$. Từ kết quả trên có thể kết luận lượng huyết sắc tố trung bình của công nhân nhà máy này thấp hơn mức chung hay không? (xét với mức $\alpha = 0,05$).
:::
#### Bài 2
:::info
Đo huyết sắc tố cho 50 công nhân nông trường thấy có 60% ở dưới $110g/l$. Số liệu chung của khu vực này là 30% ở dưới $110g/l$. Với mức ý nghĩa $\alpha = 0,10$ có thể kết luận công nhân nông trường có tỷ lệ huyết sắc tố đưới $110g/l$ cao hơn mức chung hay không?
:::
#### Bài 3
:::info
Áp lực tâm trương động mạch phổi của người bình thường là bnn chuẩn $X \cong N(5,1;\ 1,7^2)$, đơn vị đo: mmHg. Đo áp lực tâm trương động mạch phổi ở 57 người mắc cùng loại bệnh Z người ta thu được các kết quả như sau:
| X | < 4,0 | [4; 4,5) | [4,5; 5) | [5; 5,5) | [5,5; 6) | [6; 6,5) | [6,5; 7) | [7; 7,5) | [7,5; 8) | [8; 8,5) | > 8,5|
| - | - | - | - | - | - | - | - | - | - | - | - |
| Số người | 2 | 3 | 5 | 6 | 8 | 10 | 9 | 6 | 4 | 2 | 2 |
Coi như $X$ chuẩn.
a) $DX$ có như ở mức người bình thường hay không?
b) Về trung bình áp lực tâm trương động mạch phổi của người mắc bệnh Z có như mức bình thường hay không? Nếu khác thì cao hơn hay thấp hơn?
Tất cả đều xét với mức ý nghĩa 5%.
:::
#### Bài 4
:::info
Một chi tiết được gia công tự động với chiều dài là bnn $N(110; 0,01)$, đơn vị đo: mm. Sau một thời gian chất lượng của máy bị giảm đi nên độ dài của chi tiết bị sai lệch nhiều so với mức quy định. Để có thông tin kiểm chứng người ta đã lấy ra 50 chi tiết do máy làm ra. Từ đó tính được $\overline X = 110,15$; $s = 0,5$. Coi như độ đài của chi tiết sản phẩm vẫn tuân theo luật chuẩn.
a) Từ thông tin trên hãy thử xem: độ lệch tiêu chuẩn của chiều dài chi tiết có còn như mức ban đầu hay không? Tăng hay giảm? (Mức ý nghĩa 5%).
b) Chiều dài trung bình của chi tiết đã dài hơn mức quy định hay không? (Mức ý nghĩa 2,5%).
c) Bạn có yên tâm với các kết luận trên hay không? Nếu chưa yên tâm thì nên làm thế nào?
:::
#### Bài 5
:::info
Một loại thuốc chữa bệnh được nhà sản xuất khẳng định khả năng khỏi bệnh khi dùng thuốc là 90%. Theo dõi 90 người dùng thuốc thấy có 75 người khỏi. Với mức ý nghĩa $\alpha = 0,05$ có thể nói khẳng định của nhà sản xuất là quá cao so với thực tế hay không?
:::
#### Bài 6
:::info
Chỉ số octan của xăng là 92. Nghi ngờ có sự pha trộn dầu hoả vào xăng, công ty xăng dầu đã lấy 50 mẫu để kiểm tra và đã tính được chỉ số octan trung bình mẫu là 89,5; độ lệch tiêu chuẩn mẫu là 3. Từ các số liệu trên có thể khẳng định chỉ số octan của lô xăng này đã bị giảm đi, tức là xăng đã bị pha trộn loại kém chất lượng vào hay không? ($\alpha = 0,10$).
:::
#### Bài 7
:::info
Tháng 9/2002 là tháng an toàn giao thông trên toàn quốc, nhưng số vụ tai nạn trong tháng này lại gia tăng. Theo số liệu công bố trên VTV trong tháng 9 đã có 980 người chết vì tai nạn giao thông (trong khi đó số người bị chết trong 2 năm giao tranh giữa Ixraen và Palestin tổng cộng cả hai bên cũng chỉ khoảng 2100 người), tỷ lệ các vụ tai nạn do mô tô xe máy gây ra chiếm 72%.
Điều tra một số điểm nóng về an toàn giao thông ở một địa phương trong tháng 10 thì thấy trong số 270 vụ tai nạn giao thông đường bộ đã có 190 vụ là do mô tô xe máy gây ra. Theo bạn số liệu ở tháng 9 và tháng 10 nói trên, số liệu nào là số liệu mẫu, số liệu nào là sế liệu điều tra đầy đủ và chính xác?
Với mức ý nghĩa 10% có thể khẳng định tỷ lệ các vụ tai nạn do mô tố xe máy gây ra ở địa phương này đã giảm so với mức chung ở tháng 9 hay không?
:::
#### Bài 8
:::info
Ta có một mẫu ngẫu nhiên được rút ra từ bnn chuẩn $N(EX;\ 36)$ với cỡ mẫu $n = 25$.
a) Hãy chỉ ra miền tiêu chuẩn cho bài toán $\{EX = 61\ /\ EX < 61\}$ với mức ý nghĩa 5%.
b) Tìm xác suất sai lầm loại II của miền tiêu chuẩn trên ứng với đối thiết $EX = 58$.
c) Tìm xác suất phạm sai lầm loại I và loại II đối với bài toán $EX = 61\ /\ EX = 58$ ứng với miền tiêu chuẩn $S = \{\overline X < 60\}$.
:::