I. Kiến thức
1. Xét mẫu số liệu ghép nhóm được cho ở bảng sau:
Khoảng biến thiên của mẫu số liệu ghép nhóm là: $R = {u_{k + 1}} – {u_1}$
2. Tứ phân vị thứ $k$, kí hiệu là ${Q_k}$, với $k = 1,2,3$ của mẫu số liệu ghép nhóm được xác định như sau:
${Q_k} = {u_m} + \frac{{\frac{{kn}}{4} – C}}{{{n_m}}}\left( {{u_{m + 1}} – {u_m}} \right)$, trong đó:
– $n = {n_1} + {n_2} + \ldots + {n_k}$ là cỡ mẫu;
– $\left[ {{u_m};{u_{m + 1}}} \right)$ là nhóm chứa tứ phân vị thứ $k$;
– ${n_m}$ là tần số của nhóm chứa tứ phân vị thứ $k$;
– $C = {n_1} + {n_2} + \ldots + {n_{m – 1}}$.
3. Khoảng tứ phân vị của mẫu số liệu ghép nhóm là ${\Delta _Q} = {Q_3} – {Q_1}$
Chú ý:
- Nếu tứ phân vị thứ $k$ là $\frac{1}{2}\left(x_m+x_{m+1}\right)$, trong đó $x_m$ và $x_{m+1}$ thuộc hai nhóm liên tiếp, ví dụ như $x_m \in\left[u_{j-1} ; u_{j}\right )$ và $x_{m+1} \in\left[u_j ; u_{j+1}\right)$ thì ta lấy $Q_k=u_j$.
- Phần tử $x$ trong mẫu là giá trị ngoại lệ nếu $x>Q_3+1,5 \Delta_Q$ hoặc $x<Q_1-1,5 \Delta_Q$.
II. Giải bài tập
Câu 1. Bảng sau thống kê tổng lượng mưa (đơn vị: mm) đo được vào tháng 7 từ năm 2002 đến 2021 tại một trạm quan trắc đặt ở Cà Mau.
(Nguồn: Tổng cục Thống kê)
a) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu trên.
b) Hãy chia mẫu số liệu trên thành 4 nhóm với nhóm đầu tiên là [140; 240) và lập bảng tần số ghép nhóm.
c) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu ghép nhóm và so sánh với kết quả tương ứng thu được ở câu a).
Lời giải
Lời giải
a) Tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu trên.
Sắp xếp lại bảng số liệu theo thứ tự không giảm ta được bảng sau:
* Tìm khoảng biến thiên
– Khoảng biến thiên là $R = {x_{20}} – {x_1} = 520 – 147 = 373$
* Tìm khoảng khoảng tứ phân vị
– Xác định ${Q_1}$.
Xem cách tính nhanh Q1 và Q3 tại đây
Ta có: ${Q_1} = \frac{{{x_5} + {x_6}}}{2} = \frac{{251,4 + 258,4}}{2} = 254,9$
– Xác định ${Q_3}$.
Ta có: ${Q_3} = \frac{{{x_{15}} + {x_{16}}}}{2} = \frac{{413,5 + 421}}{2} = 417,25$
Vậy, Khoảng tứ phân vị là: $\Delta Q = {Q_3} – {Q_1} = 417,25 – 254,9 = 162,35$.
b) Bảng tần số ghép nhóm
c) * Tìm khoảng biến thiên
– Khoảng biến thiên là: $R = {u_5} – {u_1} = 540 – 140 = 400$.
* Tìm khoảng khoảng tứ phân vị
– Xác định ${Q_1}$.
Ta có: ${x_1},\,{x_2},\,{x_3} \in \,\left[ {140;240} \right)$; ${x_4},\,…,\,{x_{10}} \in \left[ {240;340} \right)$;
${x_{11}},\,…,\,{x_{16}} \in \left[ {340;440} \right)$;${x_{17}},\,…,\,{x_{20}} \in \left[ {440;540} \right)$
Ta có: ${Q_1} = \frac{{{x_5} + {x_6}}}{2} \in \left[ {240;340} \right)$
${Q_1} = {u_2} + \frac{{\frac{{1.n}}{4} – C}}{{{n_2}}}\left( {{u_3} – {u_2}} \right)$$ = {u_2} + \frac{{\frac{{1.n}}{4} – {n_1}}}{{{n_2}}}\left( {{u_3} – {u_2}} \right) = $
$ = 240 + \frac{{\frac{{20}}{4} – 3}}{7}(340 – 240) = \frac{{1880}}{7} \approx 268,6$
– Xác định ${Q_3}$.
Ta có: ${Q_3} = \frac{{{x_{15}} + {x_{16}}}}{2} \in \left[ {340;440} \right)$$ \Rightarrow m = 3$
${Q_3} = {u_3} + \frac{{\frac{{3n}}{4} – \left( {{n_1} + {n_2}} \right)}}{{{n_3}}}\left( {{u_4} – {u_3}} \right)$
$ = 340 + \frac{{\frac{{3.20}}{4} – \left( {3 + 7} \right)}}{6}\left( {440 – 340} \right) = \frac{{1270}}{3} \approx 423,3$
Vậy, Khoảng tứ phân vị là: $\Delta Q = {Q_3} – {Q_1} = \frac{{1270}}{3} – \frac{{1880}}{7} = \frac{{3250}}{{21}} \approx 154,77$
Câu 2. Biểu đồ dưới đây biểu diễn số lượt khách hàng đặt bàn qua hình thức trực tuyến mỗi ngày trong quý III năm 2022 của một nhà hàng. Cột thứ nhất biểu diễn số ngày có từ 1 đến dưới 6 lượt đặt bàn; cột thứ hai biểu diễn số ngày có từ 6 đến dưới 11 lượt đặt bàn; …
Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm cho bởi biểu đồ trên.
Lời giải
Từ biểu đồ ta lập được bảng tần số ghép nhóm như sau:
Cỡ mẫu $n = 92$
Ta có: ${x_1},\,…,{x_{14}} \in \left[ {1;6} \right)$; ${x_{15}},\,…,{x_{44}} \in \left[ {6;11} \right)$; ${x_{45}},\,…,{x_{69}} \in \left[ {11;16} \right)$; ${x_{70}},\,…,{x_{87}} \in \left[ {16;21} \right)$; ${x_{88}},\,…,{x_{92}} \in \left[ {11;16} \right)$.
* Tìm ${Q_1}$.
Ta có: ${Q_1} = \frac{{{x_{23}} + {x_{24}}}}{2} \in \left[ {6;11} \right)$$ \Rightarrow m = 2$
Áp dụng công thức ${Q_k} = {u_m} + \frac{{\frac{{kn}}{4} – C}}{{{n_m}}}\left( {{u_{m + 1}} – {u_m}} \right)$
Ta có: ${Q_1} = {u_2} + \frac{{\frac{{1.n}}{4} – {n_1}}}{{{n_2}}}\left( {{u_3} – {u_2}} \right) = 6 + \frac{{\frac{{92}}{4} – 14}}{{30}}\left( {11 – 6} \right) = \frac{{15}}{2} = 7,5$
* Tìm ${Q_3}$.
Ta có: ${Q_3} = \frac{{{x_{69}} + {x_{70}}}}{2}$ mà ${x_{69}} \in \left[ {11;16} \right)$ và ${x_{70}} \in \left[ {16;21} \right)$ nên ${Q_3} = 16$.
Vậy, Khoảng tứ phân vị là: $\Delta Q = {Q_3} – {Q_1} = 16 – 7.5 = 8.5$
Câu 3. Kết quả đo chiều cao của 100 cây keo 3 năm tuổi tại một nông trường được cho ở bảng sau:
Chiều cao (m) | [8,4; 8,6) | [8,6; 8,8) | [8,9; 9,0) | [9,0; 9,2) | [9,2; 9,4) |
Số cây | 5 | 12 | 25 | 44 | 14 |
a) Hãy tìm khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.
b) Trong 100 cây keo trên có 1 cây cao 8,4 m. Hỏi chiều cao của cây keo này có phải là giá trị ngoại lệ không?
Lời giải
a) * Khoảng biến thiên là: $R = {u_6} – {u_1} = 9,4 – 8,4 = 1$
* Tìm khoảng tứ phân vị.
Ta có: ${x_1},\,…,\,{x_2} \in \left[ {8,4; 8,6} \right)$; ${x_6},\,…,\,{x_{17}} \in \left[ {8,6; 8,8} \right)$; ${x_{18}},\,…,\,{x_{42}} \in \left[ {8,8; 9,0} \right)$;
${x_{43}},\,…,\,{x_{86}} \in \left[ {9,0; 9,2} \right)$; ${x_{87}},\,…,\,{x_{100}} \in \left[ {9,2; 9,4} \right)$.
– Tính ${Q_1}$.
Ta có: ${Q_1} = \frac{{{x_{25}} + {x_{26}}}}{2} \in \left[ {8,8; 9,0} \right)$$ \Rightarrow m = 3$
Áp dụng công thức: ${Q_k} = {u_m} + \frac{{\frac{{kn}}{4} – C}}{{{n_m}}}\left( {{u_{m + 1}} – {u_m}} \right)$ . Ta có:
${Q_1} = {u_3} + \frac{{\frac{{1.n}}{4} – C}}{{{n_3}}}\left( {{u_4} – {u_3}} \right)$$ = 8,8 + \frac{{\frac{{1.100}}{4} – (5 + 12)}}{{25}}.\left( {9,0 – 9,8} \right) = \frac{{1108}}{{125}} = 8,864$
– Tính ${Q_3}$.
Ta có: ${Q_1} = \frac{{{x_{75}} + {x_{76}}}}{2} \in \left[ {9,0; 9,2} \right)$$ \Rightarrow m = 4$
Áp dụng công thức: ${Q_k} = {u_m} + \frac{{\frac{{kn}}{4} – C}}{{{n_m}}}\left( {{u_{m + 1}} – {u_m}} \right)$ . Ta có:
${Q_3} = {u_4} + \frac{{\frac{{3.n}}{4} – C}}{{{n_4}}}\left( {{u_5} – {u_4}} \right)$$ = 9,0 + \frac{{\frac{{3.100}}{4} – \left( {5 + 12 + 25)} \right)}}{{44}}\left( {9,2 – 9,0} \right) = \frac{{183}}{{20}} = 9,15$
Vậy, khoảng tứ phân vị là: $\Delta Q = {Q_3} – {Q_1} = 9,15 – 8,864 = 0,286$
b) Ta có ${Q_1} – 1,5{\Delta _Q} = 8,435 > 8,4$ nên chiều cao $8,4\;m$ của cây keo là giá trị ngoại lệ của mẫu số liệu ghép nhóm.
Câu 4. Bảng tần số ghép nhóm dưới đây thể hiện kết quả điều tra về tuổi thọ trung bình của nam giới và nữ giới ở 50 quốc gia.
Giới tính | Nam | Nũ |
[50; 55) | 4 | 3 |
[55; 60) | 7 | 4 |
[60; 65) | 4 | 5 |
[65; 70) | 6 | 3 |
[70; 75) | 15 | 7 |
[75; 80) | 12 | 14 |
[80; 85) | 2 | 13 |
[85; 90) | 0 | 1 |
a) Hãy tính các khoảng tứ phân vị của tuổi thọ trung bình của nam giới và nữ giới trong mẫu số liệu ghép nhóm trên.
b) Hãy cho biết tuổi thọ trung bình của nam giới hay nữ giới trong mẫu số liệu ghép nhóm trên đồng đều hơn.
Lời giải