Hướng dẫn tính toán cỡ mẫu cho kiểm định Repeated Measures ANOVA
1. Repeated Measures ANOVA là gì?
Repeated Measures ANOVA (Phân tích phương sai với số đo lặp lại) là một phương pháp thống kê được sử dụng khi cùng một nhóm đối tượng được đo nhiều lần trên cùng một biến phụ thuộc trong các điều kiện hoặc thời điểm khác nhau.
Phạm vi ứng dụng:
Repeated Measures ANOVA được áp dụng rộng rãi trong các nghiên cứu y sinh và y tế công cộng, khi cần so sánh sự thay đổi của một biến qua thời gian hoặc qua các điều kiện khác nhau:
- Theo dõi hiệu quả điều trị tại nhiều thời điểm.
- So sánh đáp ứng sinh học trong các điều kiện hoặc liều lượng khác nhau.
- Đánh giá thay đổi hành vi hoặc thái độ qua các giai đoạn can thiệp.
Ví dụ trong nghiên cứu:
- Nghiên cứu lâm sàng:
- Theo dõi huyết áp của bệnh nhân tại 3 thời điểm: trước điều trị, sau 1 tháng, và sau 3 tháng.
- Nghiên cứu dinh dưỡng:
- So sánh mức đường huyết của một nhóm bệnh nhân sau khi sử dụng 3 chế độ ăn khác nhau.
- Y tế công cộng:
- Đánh giá tác động của chiến dịch truyền thông sức khỏe đối với kiến thức người dân qua các thời điểm khảo sát khác nhau.
2. Công thức tính cỡ mẫu cho Repeated Measures ANOVA
Cỡ mẫu cho kiểm định Repeated Measures ANOVA được tính toán dựa trên các tham số chính:
- Số lần đo lặp lại (\(p\)): Số thời điểm hoặc điều kiện trong nghiên cứu.
- Kích thước hiệu ứng chuẩn hóa (\(f\)): Đo lường mức độ thay đổi của biến phụ thuộc qua các lần đo.
- Hệ số tương quan giữa các lần đo (\(\rho\)): Đo mức độ tương quan giữa các lần đo trên cùng một đối tượng.
- Mức ý nghĩa (\(\alpha\)): Xác suất chấp nhận sai lầm loại I.
- Độ mạnh kiểm định (\(1 - \beta\)): Xác suất phát hiện khác biệt có ý nghĩa khi khác biệt tồn tại.
Công thức tổng quát:
\[
n = \frac{(\eta + 1)(Z_{1-\alpha} + Z_{1-\beta})^2}{f^2 (1 - \rho)}
\]
Trong đó:
- \(n\): Số mẫu cần thiết cho mỗi nhóm.
- \(\eta = p - 1\): Bậc tự do của số lần đo lặp lại.
- \(f\): Kích thước hiệu ứng chuẩn hóa (nhỏ = 0.1, trung bình = 0.25, lớn = 0.4).
- \(\rho\): Hệ số tương quan giữa các lần đo.
- \(Z_{1-\alpha}\): Giá trị tới hạn của phân phối chuẩn tương ứng mức ý nghĩa.
- \(Z_{1-\beta}\): Giá trị tới hạn tương ứng với độ mạnh kiểm định.
Tổng cỡ mẫu cho toàn bộ nghiên cứu:
\[
n_{\text{total}} = n \times \text{số nhóm}
\]
3. Ví dụ minh họa
Bài toán:
Bạn muốn đánh giá sự thay đổi điểm huyết áp của một nhóm bệnh nhân tại 3 thời điểm:
- Trước khi điều trị.
- Sau 1 tháng điều trị.
- Sau 3 tháng điều trị.
Các tham số:
- \(p = 3\)
- \(f = 0.25\)
- \(\rho = 0.5\)
- \(\alpha = 0.05\)
- \(1 - \beta = 0.8\)
Tính toán từng bước sẽ cho kết quả \(n \approx 753\)
4. Hướng dẫn tính toán cỡ mẫu bằng R
Mã R mẫu:
library(pwr)
# Hiệu ứng điều chỉnh với hệ số tương quan
adjusted_effect_size <- 0.25 * sqrt(1 - 0.5)
# Tính cỡ mẫu
result <- pwr.anova.test(
k = 3, # Số thời điểm
f = adjusted_effect_size,
sig.level = 0.05,
power = 0.8
)
print(result)
Kết quả trả về:
Balanced one-way analysis of variance power calculation
k = 3
n = 752.64
f = 0.1767767
sig.level = 0.05
power = 0.8
Kết luận:
- Cỡ mẫu cần thiết cho mỗi nhóm: \(n = 753\)
- Tổng cỡ mẫu (với 1 nhóm): \(n_{\text{total}} = 753\)
5. Kết luận
Repeated Measures ANOVA là một công cụ mạnh mẽ để phân tích dữ liệu lặp lại trên cùng một đối tượng, giúp kiểm tra hiệu quả của các can thiệp qua thời gian hoặc trong các điều kiện khác nhau. Việc tính toán cỡ mẫu đúng cách giúp đảm bảo nghiên cứu có đủ sức mạnh thống kê để phát hiện sự khác biệt thực sự.