Hồi quy Cox (Mô hình Tỷ lệ rủi ro Cân xứng)

1. Giới thiệu về Hồi quy Cox

Mô hình hồi quy Cox, hay mô hình tỷ lệ rủi ro cân xứng (Proportional Hazards Model), là công cụ cơ bản trong phân tích sống còn (survival analysis). Mục tiêu là đánh giá mối liên hệ giữa các yếu tố dự báo (ví dụ: phơi nhiễm, điều trị, đặc điểm cá nhân) và thời gian xảy ra biến cố (như tử vong, tái phát bệnh, phục hồi...).

Mô hình Cox là bán tham số (semi-parametric) – nghĩa là không cần giả định về dạng phân phối của thời gian sống, mà chỉ xem xét mối quan hệ giữa biến độc lập và nguy cơ xảy ra biến cố.

Công thức mô hình

Mô hình Cox biểu diễn hàm rủi ro (hazard function) $h(t)$ tại thời điểm $t$ cho một cá thể có bộ biến dự báo $\mathbf{X} = (X_1, X_2, \dots, X_k)$ như sau:

$$ h(t | \mathbf{X}) = h_0(t) \times \exp\left(\sum_{i=1}^{k} \beta_i X_i\right) $$

Trong đó:

Diễn giải: Nếu $HR = 1$, biến không ảnh hưởng đến rủi ro; nếu $HR > 1$, biến làm tăng rủi ro; nếu $HR < 1$, biến có tác dụng bảo vệ.

2. Tính cỡ mẫu cho Hồi quy Cox

Theo công thức của Schoenfeld (1983), số biến cố cần thiết ($E$) để đạt được công suất mong muốn là:

$$ E = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2}{p_1 p_2 [\ln(HR)]^2} $$

Trong đó:

Tổng cỡ mẫu cần thiết được ước lượng là:

$$ N = \frac{E}{P_e} $$

Trong đó $P_e$ là xác suất xảy ra biến cố trong quần thể nghiên cứu (ước tính từ nghiên cứu trước).

3. Ứng dụng trong Y tế Công cộng

Trong nghiên cứu y tế công cộng, mô hình Cox được dùng rộng rãi để:

Ví dụ thực tế:
Một nghiên cứu muốn đánh giá tác động của việc hút thuốc đến nguy cơ tử vong do bệnh tim trong 5 năm.

Giả sử: Khi đó:
$$ E = \frac{(1.96 + 0.84)^2}{(0.4)(0.6)[\ln(1.8)]^2} \approx 125 $$
$$ N = \frac{125}{0.15} \approx 834 $$

👉 Như vậy, cần ít nhất 834 người tham gia (trong đó kỳ vọng có khoảng 125 biến cố tử vong) để có đủ công suất phát hiện tác động của hút thuốc đối với nguy cơ tử vong do bệnh tim.

Cỡ mẫu hợp lý giúp nghiên cứu phát hiện được mối liên hệ thật (tránh âm tính giả) và giảm lãng phí nguồn lực trong các thử nghiệm can thiệp hoặc theo dõi đoàn hệ.