Kiểm định F để so sánh phương sai (F-test for Variance)
Kiểm định F (F-test) được sử dụng để so sánh phương sai của hai quần thể, thường là để kiểm tra giả thuyết rằng hai biến có độ biến thiên bằng nhau. Đây là nền tảng cho các kiểm định như ANOVA, hoặc kiểm tra giả định về tính đồng nhất phương sai trước khi thực hiện các phân tích khác.
1. Giả thuyết kiểm định
Giả sử có hai mẫu độc lập với phương sai lần lượt là \( \sigma_1^2 \) và \( \sigma_2^2 \), ta muốn kiểm tra:
- \( H_0: \sigma_1^2 = \sigma_2^2 \)
- \( H_1: \sigma_1^2 \ne \sigma_2^2 \) (hai phía) hoặc \( \sigma_1^2 > \sigma_2^2 \), v.v.
2. Công thức tính thống kê kiểm định F
\[
F = \frac{S_1^2}{S_2^2}
\]
Trong đó:
- \( S_1^2 \): phương sai mẫu của nhóm 1
- \( S_2^2 \): phương sai mẫu của nhóm 2
- Theo quy ước, ta thường đặt phương sai lớn hơn ở tử số để F luôn ≥ 1.
Giá trị \( F \) tuân theo phân phối F với \( (n_1 - 1, n_2 - 1) \) bậc tự do.
3. Công thức xấp xỉ tính cỡ mẫu
Mặc dù không phổ biến như trong t-test hay chi-square, cỡ mẫu để phát hiện sự khác biệt về phương sai có thể ước tính bằng:
\[
n = \left( \frac{Z_{1-\alpha/2} + Z_{1-\beta}}{\ln(\sigma_1 / \sigma_2) \cdot \sqrt{2}} \right)^2 + 2
\]
Trong đó:
- \( \sigma_1 / \sigma_2 \): tỉ lệ giữa hai độ lệch chuẩn mong muốn phân biệt
- \( Z_{1-\alpha/2} \): điểm tới hạn phân phối chuẩn (≈ 1.96 nếu \( \alpha = 0.05 \))
- \( Z_{1-\beta} \): điểm tới hạn công suất (≈ 0.84 nếu power = 80%)
Lưu ý: Công thức trên chỉ là xấp xỉ. Để có kết quả chính xác, bạn nên dùng phần mềm chuyên dụng như G*Power, R (gói `pwr`), hoặc các công cụ tính toán trực tuyến dựa trên phân phối F chính xác.
4. Ứng dụng trong y tế công cộng
Kiểm định F được sử dụng để đánh giá sự khác biệt về độ biến thiên của một biến định lượng giữa hai nhóm, ví dụ:
- So sánh độ dao động huyết áp giữa nam và nữ.
- Kiểm tra tính đồng nhất của biến cholesterol trong hai khu dân cư khác nhau.
- Xác định xem thuốc mới có làm giảm sự dao động của đường huyết hơn thuốc cũ không.
Trong phân tích ANOVA, kiểm định F còn giúp đánh giá sự khác biệt trung bình giữa nhiều nhóm — một bước quan trọng trong phân tích y tế cộng đồng có nhiều can thiệp.