# Các nội dung bài tập môn XSTK
## Phần 3: Ước lượng tham số
### Bài tập mẫu
:::info
Để ước lượng mức xăng tiêu hao trung bình cho một loại ô tô chạy từ A đến B, phòng kỹ thuật của công ty vận tải đã quan sát mức xăng tiêu hao (X lít) trong 30 chuyến xe, kết quả được cho như sau:
| Mức xăng X lít | < 9,8 | (9,8 - 10] | (10 - 10,2] | (10,2 - 10,4] | > 10,4 |
| - | - | - | - | - | - |
| Số chuyến | 3 | 5 | 10 | 8 | 4 |
Giả thiết mức xăng tiêu hao X tuân theo luật chuẩn.
a) Hãy ước lượng mức xăng tiêu hao trung bình.
b) Với độ tin cậy 95% mức xăng tiêu hao trung bình EX năm trong khoảng nào?
c) Với xác suất 90% có thể nói mức xăng tiêu hao trung bình EX cao nhất là bao nhiêu lít?
d) Hãy ước lượng cho bình phương độ tản mát của mức xăng tiêu hao?
Với độ tin cậy 0,90 bình phương độ tản mát của mức xăng tiêu hao sẽ thuộc khoảng nào?
e) Với xác suất 0,98 tỷ lệ các chuyến xe có mức xăng tiêu hao không vượt quá 10 lít nằm trong khoảng nào? Thấp nhất là bao nhiêu %?
f) Độ chính xác của ước lượng khoảng cho EX ở câu b) là bao nhiêu? Muốn nâng độ chính xác lên 0,05 lít thì cần theo dõi bao nhiêu chuyến xe?
g) Độ chính xác của ước lượng khoảng cho tỷ lệ p (ở câu e)) là bao nhiêu? Muốn nâng độ chính xác lên gấp đôi thì cần quan sát bổ sung thêm bao nhiêu chuyến xe nữa?
h) Với số liệu quan sát ban đầu, ước lượng khoảng (10; 10,268) cho EX sẽ có độ tin cậy là bao nhiêu? Còn ước lượng khoảng (0,1267; 0,4067) cho tỷ lệ p có độ tin cậy là bao nhiêu?
:::
:::success
:::spoiler :key: **Lời giải**
Theo giả thiết bnn $X$ tuân theo luật chuẩn, nhưng phương sai chưa biết. Do đó trước tiên ta tính $\overline X$, $s^2$.
Số liệu được cho dưới dạng khoảng, cho nên ta thay mỗi khoảng bởi điểm giữa của chúng. Riêng hai bán khoảng đầu tiên và cuối cùng ta chọn điểm $9,7$ và $10,5$ (để cho các giá trị cách đều nhau, dễ tính toán hơn). Dùng máy tính đơn giản hoặc tính toán trực tiếp ta nhận được:
$\overline X=10,134$ và $s^2= 0,053644=(0,2816)^2$
a) Nếu nói rõ: Hãy chỉ ra ước lượng điểm cho $EX$ thì không có gì phải suy xét. Còn ở câu này ta chỉ có thể hiểu là tìm ước lượng điểm (vì không cho độ tin cậy). Do vậy ước lượng cho mức xăng tiêu hao trung bình là $10,134$ lít.
b) Rõ ràng đây là ước lượng khoảng cho $EX$. Vì $DX$ chưa biết, $X$ tuân theo luật chuẩn, nên ta dùng công thức:
$1-\alpha = 0,95$ nên $\alpha = 0,05 \Rightarrow t_{29}(0,025) = 2,05$
Với độ tin cậy $95\%$ $EX$ nằm trong khoảng:
$(10,134 - 2,05\frac{0,2316}{429};\ 10,134 +2,05\frac{0,2316}{429})$
$= (10,0458;\ 10,2222)$
c) Câu trả lời sẽ là đầu mút bên phải của ước lượng khoảng với độ tin cậy $90\%$:
$10,134 + t_{29}(0,05)\frac{0,2316}{5,3852} = 10,207$ (vì $t_{29}(0,05) = 1,70$).
Vậy với xác suất $90\%$ ta có thể nói mức xăng tiêu hao trung bình $EX$ cao nhất là $10,207$ lít.
d) Câu trả lời là ước lượng điểm $\hat s^2$ và ước lượng khoảng theo công thức:
$\hat s^2 = \frac{30}{29} 0,053644 = 0,055494$
$1 - \alpha = 0,90 \Rightarrow \alpha = 0,10 \Rightarrow \chi_{29}^2(0,05)=42,6;\ \chi_{29}^2(0,95) = 17,7$
Suy ra: $(0,055494 \frac{29}{42,6};\ 0,055494\frac{29}{17,7})$ $= (0,03778;\ 0,09092)$.
Vậy bình phương độ tản mát của mức xăng tiêu hao là $0,055494$. Với độ tin cậy $90\%$ $DX \in (0,03778;\ 0,09092)$.
e) Gọi $p= P(X \leq 10)$. Ta nhận được $p^* = \frac{8}{30} = 0,2667$
Theo công thức và độ tin cậy $1 - \alpha = 0,98 \Rightarrow \alpha = 0,02$
$u(0,01) = 2,33$ nên:
$p \in (0,2667 - 2,33\sqrt{\frac{0,2667.(1-0,2667)}{30}};\ 0,2667 + 2,33\sqrt{\frac{0,2667.(1-0,2667)}{30}})$
$p \in (0,0786;\ 0,4548)$
Vậy với xác suất $98\%$ tỷ lệ số chuyến có mức xăng tiêu hao không quá 10 lít nằm trong khoảng $(7,86\%;\ 45,48\%)$. Tỷ lệ này thấp nhất là $7,86\%$ (với xs $98\%$).
f) Từ câu b) ta thấy độ chính xác của ước lượng khoảng là:
$\varepsilon = \frac{10,2222 - 10,0458}2 = 0,0882$ lít
hoặc theo công thức:
$\varepsilon = 2,05 \frac{0,2316}{5,3852} = 0,0882$ lít.
Muốn nâng độ chính xác lên 0,05 lít ta cần quan sát 92 chuyến xe, vì số chuyến xe $n$ phải thoả mãn:
$t_{n-1}(0,025)\frac{s}{\sqrt{n—1}} \leq 0,05$
Thực ra trong bất phương trình này $t_{n-1}(0,025)$ và $s$ đều phụ thuộc vào $n$, nhưng không phải dưới dạng hiển. Để xác định chính xác số $n$, sau mỗi lần bổ sung thêm một quan sát ta phải tính lại $s$ và tra bảng tìm lại giá trị t_{n-1}(0,025). Song làm như vậy sẽ quá chậm. Do đó ta thường thay $t_{n-1}(0,025)$ và $s$ bởi giá trị ứng với mẫu ban đầu. Khi đó bất đẳng thức trên trở thành:
$2,05\frac{0,2316}{\sqrt{n — 1}} \leq 0,05$
$n \geq 1 + 90,166 = 91,166 \Rightarrow n = 92$
g) Theo câu e) độ chính xác của ước lượng khoảng cho tỷ lệ $p$ là:
$2,33\sqrt{\frac{0,2667.(1-0,2667)}{30}} = 0,1881$
Bây giờ muốn có ước lượng khoảng cho $p$ với độ tin cậy $98\%$ và độ chính xác tăng lên gấp đôi, tức là $\varepsilon = 0,09405 \sim 0,0941$ thì số $n$ cần thoả mãn:
$u(0,01)\sqrt{\frac{p^*(1-p^*)}{n}} \leq 0,0941$
Thay $p^*$ bởi $0,2667$ ta có $n \geq 119,896 \Rightarrow n = 120$
Vậy phải bổ sung thêm 90 quan sát nữa.
h) Với $n = 30$ ước lượng khoảng $(10;\ 10,268)$ cho $EX$ sẽ có độ tin cậy là $> 0,99$, bởi vì độ chính xác của khoảng trên là $\frac{0,168}2 = 0,134$ cho nên:
$t_{29}(\frac{\alpha}2)\frac{0,2316}{\sqrt{29}} \leq 0,134$
$t_{29}(\frac{\alpha}2) \leq 0,134\frac{5,3852}{0,2316} = 3,116$
Tra bảng ta thấy $t_{29}(0,0025) = 3,038 < 3,116$
Suy ra $\frac\alpha2 < 0,0025$ $\Rightarrow \alpha < 0,005$ $\Rightarrow 1 - \alpha > 0,995$.
Còn ước lượng khoảng $(0,1267;\ 0,4067)$ cho tỷ lệ $p$ có độ chính xác là $\frac{0,4067 — 0,1267}2 = 0,14$ cho nên:
$u(\frac\alpha2)\sqrt{\frac{0,2667.(1 - 0,2667)}{30}} \leq 0,14$
$u(\frac\alpha2) \leq \frac{0,14}{0,081} = 1,73 \sim u(0,0418)$
$\Rightarrow \alpha \geq 2.0,04 = 0,08$ $\Rightarrow 1-\alpha \leq 0,92$
Vậy độ tin cậy cần tìm là $92\%$.
:::
### Bài tập tự luyện
#### Bài 1
:::info
Điều tra doanh số hàng tháng của 100 hộ kinh doanh một ngành nào đó ta thu được số liệu sau
| Doanh số <br /> X (triệu đồng) | 10,1 | 10,2 | 10,4 | 10,5 | 10,7 | 10,8 | 10,9 | 11 | 11,3 | 11,4 |
| - | - | - | - | - | - | - | - | - | - | - |
| Số hộ | 2 | 3 | 8 | 13 | 25 | 20 | 12 | 10 | 6 | 1|
a) Tính $\overline X$, $s^2$, $\hat s^2$ ,$s$, $\hat s$
b) Hãy chỉ ra ước lượng cho doanh số trung bình của các hộ.
c) Với độ tin cậy 95% có thể nói doanh số trung bình/tháng của các hộ nằm trong khoảng nào? (Xét cả trong hai trường hợp: Coi như X chuẩn và không có giả thiết X chuẩn; So sánh hai kết quả nhận được).
d) Ước lượng tỷ lệ % các hộ có doanh số/tháng $\geq$ 11 triệu. Với độ tin cậy 99% tỷ lệ này thấp nhất là bao nhiêu?
e) Hãy chỉ ra ước lượng cho median.
:::
#### Bài 2
:::info
Điều tra 365 điểm trồng lúa của một huyện, ta được các số liệu sau:
| Năng suất <br />(X tạ/ha) | 25 | 30 | 33 | 34 | 35 | 36 | 37 | 39 | 40 |
| - | - | - | - | - | - | - | - | - | - |
| Số điểm<br />trồng lúa | 6 | 13 | 38 | 74 | 106 | 85 | 30 | 10 | 3 |
a) Xây dựng đa giác tần suất và viết biểu thức hàm phân phối thực nghiệm.
b) Hãy ước lượng năng suất lúa trung bình/ha.
c) Với độ tin cậy 95% năng suất lúa trung bình của huyện thấp nhất và cao nhất là bao nhiêu tạ/ha?
d) Tỷ lệ % số điểm trồng lúa có năng suất cao > 35 tạ/ha? Tỷ lệ này thấp nhất là bao nhiêu với độ tin cậy 99%?
e) Ước lượng cho median. So sánh với ước lượng cho trung bình nhận được ở câu b).
Giả sử năng suất lúa X tuân theo luật chuẩn.
:::
#### Bài 3
:::info
Một khu rừng có diện tích rất lớn. Căn cứ vào kết quả điều tra ngẫu nhiên trên 31 ô, mỗi ô có diện tích 0,1ha ta tính được thể tích gỗ trung bình trên mỗi ô và sai số tiêu chuẩn là: $\overline X =10,2 m^3$; $s = 1,45 m^3$.
a) Hãy ước lượng số quan sát cần thiết để sai số ước lượng không vượt quá $0,4m^3$ với độ tin cậy 95%,
b) Nếu muốn sai số không vượt quá $0,5m^3$ thì có cần điều tra bổ sung hay không?
c) Nếu muốn sai số không vượt quá $0,5m^3$ và số quan sát không vượt quá cỡ mẫu đã điều tra thì độ tin cậy của ước lượng là bao nhiêu? Hãy chỉ ra ước lượng khoảng đó.
Giả thiết thể tích gỗ $X$ tuân theo luật chuẩn.
:::
#### Bài 4
:::info
Để ước lượng số cá trong hồ, người ta đánh bắt 2000 con, đánh dấu rồi thả xuống. Vài ngày sau ta lại bắt lên 400 con thì thấy có 80 con cá được đánh dấu. Với độ tin cậy 0,95 có thể nói số cá trong hồ khoảng bao nhiêu con?
:::
#### Bài 5
:::info
Một xí nghiệp đưa ra thị trường một sản phẩm mới. Để xem đánh giá của người tiêu dùng đối với loại sản phẩm mới này như thế nào, người ta phát cho mỗi người mua hàng một phiếu thăm dò và đề nghị gửi lại cho xí nghiệp chậm nhất là sau 3 tháng. Bước đầu xí nghiệp mới chỉ gửi phiếu thăm dò cho khách hàng ở Hà Nội. Kết quả sau 3 tháng xí nghiệp nhận được 300 phiếu thăm dò, trong đó có 90 phiếu tỏ ra là thích loại sản phẩm này (cả về chức năng và giá cả).
a) Hãy ước lượng tỷ lệ khách hàng thích loại sản phẩm này.
b) Với độ tin cậy 98% tỷ lệ đó cao nhất là bao nhiêu?
c) Muốn nhận được ước lượng khoảng cho tỷ lệ thực trên với độ tin cậy 98% và độ chính xác là 0,03 thì cần thăm dò thêm bao nhiêu phiếu nữa?
d) Với mẫu n = 300, ước lượng khoảng có độ chính xác là 0,0436 thì độ tin cậy của kết luận về ước lượng khoảng là bao nhiêu?
:::
#### Bài 6
:::info
Để nghiên cứu tuổi thọ của một loại bóng đèn người ta thắp thử 100 bóng và có số liệu sau:
| Tuổi thọ X (giờ) | Số bóng tương ứng |
| - | - |
| [1010 - 1030) | 2 |
| [1030 - 1050) | 3 |
| [1050 - 1070) | 8 |
| [1070 - 1090) | 13 |
| [1090 - 1110) | 25 |
| [1110 - 1130) | 20 |
| [1130 - 1150) | 12 |
| [1150 - 1170) | 10 |
| [1170 - 1190) | 6 |
| [1190 - 1210) | 1 |
Sau khi cải tiến kỹ thuật người ta lại thắp thử 100 bóng. Kết quả như sau:
| Tuổi thọ<br />Y (giờ) | 1150 | 1160 | 1170 | 1180 | 1190 | 1200 |
| - | - | - | - | - | - | - |
| Số bóng | 10 | 15 | 20 | 30 | 15 | 10 |
a) Hãy chỉ ra ước lượng điểm và ước lượng khoảng (với độ tin cậy 0,90) cho tuổi thọ trung bình $EX$, $EY$ và bình phương độ lệch của tuổi thọ bóng đèn $DX$, $DY$ trước và sau khi cải tiến.
b) Với độ tin cậy 95% có thể nói việc cải tiến kỹ thuật đã làm tăng tuổi thọ trung bình của bóng đèn lên ít nhất bao nhiêu giờ?
c) Nếu ước lượng khoảng cho $EX$ có độ chính xác là 6,05 thì độ tin cậy tương ứng là bao nhiêu?
d) Nếu muốn ước lượng khoảng cho $EX$ với độ tin cậy 90%, độ chính xác là 5 thì cần quan sát thêm bao nhiêu bóng đèn nữa?
Giả sử $X$ và $Y$ đều tuân theo luật chuẩn.
:::
#### Bài 7
:::info
Dùng phương pháp hấp thụ nguyên tử để phân tích lượng kẽm trong tóc, một cán bộ đã phân tích 35 mẫu tóc. Kết quả được cho như sau ($X$ là lượng kẽm trong tóc, đơn vị đo là ppm (phần triệu)):
| $X$ | 188 | 190 | 193 | 195 | 196 | 198 | 199 | 204 |
| - | - | - | - | - | - | - | - | - |
| Số mẫu| 3 | 4 | 5 | 10 | 7 | 3 | 2 | 1|
Giả sử lượng kẽm trong tóc tuân theo luật chuẩn.
a) Hãy ước lượng lượng kẽm trung bình ($EX$) chứa trong tóc.
b) Hãy ước lượng bình phương độ tản mát của lượng kẽm trong tóc, nếu:
- Lượng kẽm trung bình $EX$ chưa biết.
- Lượng kẽm trung bình $EX$ đã biết và bằng $195,0$
- Nhận xét gì qua hai kết quả nhận được.
c) Với độ tin cậy 0,95 có thể nói lượng kẽm trung bình thuộc khoảng nào? Cao nhất là bao nhiêu? Thấp nhất là bao nhiêu? Khả năng đúng của các kết luận trên là bao nhiêu? Khả năng sai là bao nhiêu?
d) Độ chính xác của ước lượng khoảng nhận được ở trên là bao nhiêu? Muốn độ chính xác là 3 ppm thì cần phân tích bao nhiêu mẫu tóc?
e) Với mẫu đã cho ban đầu, ước lượng khoảng cho $EX$ có độ chính xác là 2 ppm thì độ tin cậy là bao nhiêu? So với câu e) có thể rút ra nhận xét gì?
:::
#### Bài 8
:::info
Đo sức bền chịu lực của một loại ống công nghiệp, người ta thu được các số liệu sau: 4500 6500 5000 5200 4800 4900 5215 6200 5375.
Từ kinh nghiệm nghề nghiệp người ta biết sức bền đó có phân phối chuẩn với độ lệch tiêu chuẩn $\sigma$ = 300.
a) Hãy chỉ ra ước lượng cho sức bền chịu lực trung bình ($EX$).
b) Khoảng tin cậy 95% cho sức bền chịu lực trung bình của loại ống trên nằm trong khoảng nào? Cao nhất là bao nhiêu?
c) Độ chính xác của khoảng tin cậy trên là bao nhiêu? Muốn nâng độ chính xác lên gấp đôi thì cần đo bao nhiêu ống?
d) Với 9 số liệu ban đầu thì khoảng tin cậy sau cho $EX$ sẽ có độ tin cậy là bao nhiêu $(5100;\ 5497,78)$?
So sánh với khoảng nhận được ở câu b) rút ra nhận xét gì?
:::