Giới thiệu Tính cỡ mẫu cho Phân tích Sống sót (Log-rank Test)

Trong nghiên cứu Y tế công cộng, các nhà nghiên cứu thường quan tâm đến thời gian xảy ra một biến cố (như tử vong, tái phát bệnh, hồi phục, hoặc ngừng điều trị). Phân tích sống sót (survival analysis) giúp mô hình hóa xác suất sống sót hoặc nguy cơ theo thời gian.

Khi cần so sánh hai nhóm (ví dụ: nhóm can thiệp và nhóm chứng), phép kiểm định phổ biến nhất là Log-rank test. Việc tính toán cỡ mẫu phù hợp là bước quan trọng để đảm bảo đủ công suất thống kê (power) để phát hiện khác biệt thật sự giữa hai nhóm.

1. Nguyên lý của Log-rank Test

Giả thuyết cần kiểm định:

Log-rank test dựa trên so sánh số sự kiện (ví dụ tử vong) quan sát được so với kỳ vọng ở mỗi nhóm, tích lũy theo thời gian.

2. Các Thông số Cần Biết Trước Khi Tính Cỡ Mẫu

3. Công thức Tính Cỡ Mẫu (Freedman, 1982)

Số sự kiện cần thiết (chứ chưa phải số người) để đạt công suất mong muốn:

$$E = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2}{[\ln(HR)]^2 \, r(1 - r)}$$

Trong đó:

Sau đó, tổng cỡ mẫu $N$ được ước tính từ $E$ và xác suất xảy ra sự kiện:

$$N = \frac{E}{p}$$

Nếu có thời gian tuyển chọn và theo dõi khác nhau, cần điều chỉnh thêm cho hiện tượng kiểm duyệt (censoring).

Ví dụ minh họa

Một thử nghiệm cộng đồng về can thiệp giảm nguy cơ tử vong tim mạch có:

Tính toán:

$$E = \frac{(1.96 + 0.84)^2}{[\ln(0.7)]^2 (0.5)(0.5)} \approx 62.5$$ $$N = \frac{62.5}{0.25} = 250$$

👉 Như vậy, cần khoảng 250 người (125 mỗi nhóm) để đạt 80% power trong điều kiện tỷ lệ sự kiện 25%.

4. Mở rộng Cho Tình Huống Y Tế Công Cộng

5. Quy tắc Kinh nghiệm


Kết luận: Trong Y tế công cộng, khi thiết kế nghiên cứu can thiệp hoặc theo dõi bệnh nhân, nên ưu tiên dùng công thức Freedman (1982) để ước tính số sự kiện cần thiết, sau đó điều chỉnh theo tỷ lệ biến cố kỳ vọng và thời gian theo dõi. Khi dữ liệu phức tạp hoặc có kiểm duyệt cao, hãy dùng mô phỏng để ước tính công suất thực tế.