Hướng dẫn tính toán cỡ mẫu cho kiểm định ANOVA (Phân tích phương
sai)
1. Kiểm định ANOVA là gì?
Kiểm định ANOVA (Analysis of Variance) là một phương pháp thống kê dùng để
kiểm tra xem có sự khác biệt có ý nghĩa thống kê giữa trung bình của nhiều
nhóm độc lập hay không.
Phạm vi ứng dụng:
Kiểm định ANOVA được sử dụng rộng rãi trong các nghiên cứu y tế, khoa học xã
hội và giáo dục, đặc biệt khi cần so sánh trung bình của hơn 2 nhóm độc
lập.
Ví dụ:
- So sánh trung bình cân nặng giữa 3 nhóm trẻ em được bổ sung dinh dưỡng ở
các mức độ khác nhau.
- So sánh điểm trung bình của sinh viên giữa 4 phương pháp giảng dạy.
- So sánh thời gian sống sót trung bình giữa 3 loại thuốc.
2. Công thức tính cỡ mẫu cho kiểm định ANOVA
Công thức tổng quát để tính cỡ mẫu cho kiểm định ANOVA dựa trên kích thước
hiệu ứng chuẩn hóa (
f), mức ý nghĩa (
α), và độ mạnh kiểm định (
1−β):
n=f2(η+1)(Z1−α+Z1−β)2
Trong đó:
- n: Số mẫu cần thiết cho mỗi nhóm.
- η: Bậc tự do giữa các nhóm (η=k−1, vớik là số nhóm).
- f: Kích thước hiệu ứng chuẩn hóa:
- f=0.1: Hiệu ứng nhỏ.
- f=0.25: Hiệu ứng trung bình.
- f=0.4: Hiệu ứng lớn.
- Z1−α: Điểm tới hạn từ phân phối
chuẩn theo mức ý nghĩaα.
- Z1−β: Điểm tới hạn từ phân phối
chuẩn tương ứng với độ mạnh kiểm định.
3. Đặc biệt khi chỉ có 2 nhóm
Khi số nhóm
k=2, kiểm định ANOVA trở thành kiểm
định t-test hai mẫu độc lập.
Trong trường hợp này, công thức
trên được đơn giản hóa thành:
n=f22(Z1−α+Z1−β)2
Nhận xét:
- Nếu nghiên cứu của bạn luôn chỉ so sánh 2 nhóm, bạn nên sử dụng
kiểm định t-test hai mẫu độc lập để đơn giản hóa.
- Tuy nhiên, nếu có khả năng mở rộng số lượng nhóm (nhiều hơn 2), kiểm định
ANOVA sẽ là phương pháp tổng quát hơn.
4. Hướng dẫn tính toán
Cách tính cỡ mẫu
Để tính cỡ mẫu cho kiểm định ANOVA, bạn cần cung cấp:
- Kích thước hiệu ứng (f):
- f=0.1: Hiệu ứng nhỏ.
- f=0.25: Hiệu ứng trung bình.
- f=0.4: Hiệu ứng lớn.
- Mức ý nghĩa (α): Thường là 0.05.
- Độ mạnh kiểm định (1−β): Thường là 0.8
hoặc 0.9.
- Số nhóm (k): Nhập số nhóm cần
so sánh.
Tổng cỡ mẫu
Tổng cỡ mẫu cho toàn bộ nghiên cứu được tính bằng:
ntotal=n×k
Với
n là số mẫu cần thiết cho mỗi nhóm, và
k là số nhóm.
5. Ví dụ minh họa
Bài toán:
Bạn muốn kiểm tra sự khác biệt trung bình cân nặng giữa 3 nhóm trẻ em được bổ
sung dinh dưỡng ở mức độ khác nhau với:
- Kích thước hiệu ứng (f) = 0.25 (hiệu ứng trung bình).
- Mức ý nghĩa (α) = 0.05.
- Độ mạnh kiểm định (1−β) = 0.8.
- Số nhóm (k=3).
Áp dụng công thức:
-
Bậc tự do giữa các nhóm:
η=k−1=3−1=2
-
Tra bảng phân phối chuẩn:
- Z1−α=Z0.95=1.96.
- Z1−β=Z0.8=0.84.
-
Tính cỡ mẫu cho mỗi nhóm:
n=f2(η+1)(Z1−α+Z1−β)2n=0.252(2+1)(1.96+0.84)2=0.06253×7.84=0.062523.52=376.32
-
Tổng cỡ mẫu:
ntotal=n×k=376.32×3=1129
Kết luận:
Cần ít nhất 376 mẫu cho mỗi nhóm và tổng cộng 1129
mẫu cho cả nghiên cứu.
6. Công cụ tính toán bằng R
Bạn có thể tính cỡ mẫu cho kiểm định ANOVA bằng hàm
pwr.anova.test
trong R:
R
library(pwr)
pwr.anova.test(k = 3, f = 0.25, sig.level = 0.05, power = 0.8)
Kết quả trả về:
- Số mẫu cần thiết cho mỗi nhóm (n).
- Tổng số mẫu nếu bạn nhân với số nhóm (k).