Kiểm định Levene (Levene’s Test)
Kiểm định Levene được sử dụng để đánh giá sự bằng nhau của phương sai (homogeneity of variance) giữa hai hay nhiều nhóm. Đây là kiểm định phổ biến hơn F-test khi dữ liệu không tuân theo phân phối chuẩn, vì nó ít nhạy cảm với sự vi phạm giả định chuẩn.
1. Giả thuyết kiểm định
- \( H_0: \sigma_1^2 = \sigma_2^2 = \dots = \sigma_k^2 \) (phương sai của các nhóm là bằng nhau)
- \( H_1: \) Có ít nhất một cặp nhóm có phương sai khác nhau
2. Ý tưởng phương pháp
Thay vì dùng giá trị gốc \( Y_{ij} \), Levene’s Test hoạt động trên độ lệch tuyệt đối giữa mỗi quan sát và trung vị hoặc trung bình của nhóm đó:
\[
Z_{ij} = | Y_{ij} - \tilde{Y}_{\cdot j} |
\]
Trong đó:
- \( Y_{ij} \): giá trị của quan sát thứ \( i \) trong nhóm \( j \)
- \( \tilde{Y}_{\cdot j} \): trung vị (hoặc trung bình) của nhóm \( j \)
Sau đó, một kiểm định ANOVA một yếu tố được thực hiện trên biến mới \( Z_{ij} \). Nếu có sự khác biệt đáng kể về trung bình của \(Z_{ij}\) giữa các nhóm, điều đó ngụ ý rằng phương sai của các giá trị gốc không đồng nhất.
3. Thống kê kiểm định (W-statistic)
Thống kê Levene (W) có công thức tương tự như thống kê F trong ANOVA:
\[
W = \frac{(N - k)}{(k - 1)} \cdot \frac{\sum_{j=1}^k n_j (\bar{Z}_{\cdot j} - \bar{Z}_{\cdot\cdot})^2}{\sum_{j=1}^k \sum_{i=1}^{n_j} (Z_{ij} - \bar{Z}_{\cdot j})^2}
\]
Trong đó:
- \( N \): tổng số quan sát, \( k \): số nhóm
- \( \bar{Z}_{\cdot j} \): trung bình của \( Z_{ij} \) trong nhóm \( j \)
- \( \bar{Z}_{\cdot\cdot} \): trung bình của tất cả các giá trị \( Z_{ij} \)
Giá trị \( W \) được so sánh với phân phối \( F_{k-1, N-k} \). Nếu p-value nhỏ hơn mức ý nghĩa (thường là 0.05), chúng ta bác bỏ \( H_0 \).
4. Ứng dụng trong y tế công cộng
- So sánh sự biến động của huyết áp giữa ba khu vực dân cư khác nhau.
- Kiểm tra độ ổn định của chỉ số đường huyết giữa các nhóm bệnh nhân dùng các loại thuốc khác nhau.
- Đánh giá tính đồng nhất phương sai trước khi thực hiện phân tích ANOVA, đặc biệt khi nghiên cứu hiệu quả của nhiều can thiệp.
5. Ghi chú
- Levene’s Test có thể dùng trung vị hoặc trung bình trong công thức. Phiên bản dùng trung vị (thường được gọi là Brown–Forsythe test) được khuyến nghị khi dữ liệu có các giá trị ngoại lai (outliers).
- Đây là một kiểm định giả định rất quan trọng trước khi thực hiện ANOVA hoặc các mô hình hồi quy có biến phân loại.