Thiết kế chéo (Crossover Design) là một loại thiết kế nghiên cứu can thiệp vô cùng hiệu quả. Trong thiết kế này, mỗi người tham gia sẽ lần lượt nhận TẤT CẢ các can thiệp (ví dụ: đầu tiên dùng thuốc A, sau đó dùng thuốc B).
Ưu điểm lớn nhất là mỗi bệnh nhân tự làm đối chứng cho chính mình. Điều này giúp loại bỏ "biến thiên giữa các cá nhân" (inter-patient variability) - vốn là nguồn "nhiễu" (noise) lớn nhất trong các nghiên cứu song song (parallel-group trials).
Một thiết kế chéo 2x2 (hai can thiệp, hai giai đoạn) điển hình bao gồm:
Việc ngẫu nhiên hóa thứ tự (sequence) giúp chúng ta kiểm soát một yếu tố gây nhiễu quan trọng gọi là "hiệu ứng giai đoạn" (period effect), tức là sự thay đổi tự nhiên của bệnh theo thời gian.
Thiết kế này không thể dùng cho mọi loại bệnh. Nó có các điều kiện áp dụng nghiêm ngặt:
Đây là điều kiện bắt buộc. Giữa Giai đoạn 1 và Giai đoạn 2, phải có một giai đoạn "rửa trôi" đủ dài để đảm bảo tác dụng của can thiệp đầu tiên đã biến mất hoàn toàn trước khi bắt đầu can thiệp thứ hai.
Nếu giai đoạn này quá ngắn, "hiệu ứng tồn dư" (carryover effect) sẽ xảy ra, làm sai lệch kết quả của Giai đoạn 2 và khiến phân tích trở nên vô nghĩa.
Đây là trường hợp phổ biến nhất, ví dụ so sánh mức giảm huyết áp, nồng độ HbA1c, v.v. Vì mỗi bệnh nhân ($i$) có hai kết quả ($\text{Giá_trị}_{i,A}$ và $\text{Giá_trị}_{i,B}$), chúng ta phân tích dựa trên hiệu số bên trong từng bệnh nhân: $$d_i = \text{Giá_trị}_{i,A} - \text{Giá_trị}_{i,B}$$
Bài toán trở thành kiểm định T-test một mẫu (one-sample t-test) để xem trung bình của các hiệu số ($\mu_d$) có khác 0 hay không. Công thức tính tổng cỡ mẫu $n$ là:
$$n = \frac{\sigma_d^2 (Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2}$$
Tham số $\sigma_d$ (Độ lệch chuẩn của hiệu số) rất khó tìm trong y văn. Thay vào đó, chúng ta thường tìm được $\sigma_p$ (Độ lệch chuẩn "chung" từ nghiên cứu song song) và $\rho$ (Hệ số tương quan giữa 2 lần đo trên cùng một bệnh nhân).
Chúng có mối liên hệ qua công thức:
$$\sigma_d^2 = 2\sigma_p^2 (1-\rho)$$
Thay vào công thức cỡ mẫu ở trên, ta có công thức thực tế hơn:
$$n = \frac{2\sigma_p^2 (1-\rho) (Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2}$$
So sánh 2 thuốc hạ huyết áp (A vs B) với các tham số: $\Delta = 5 \text{ mmHg}$, $\sigma_p = 15 \text{ mmHg}$ (độ lệch chuẩn chung), $\alpha=0.05$, power=80%.
1. Nếu dùng Thiết kế Song song (Parallel): $$n_{\text{mỗi nhóm}} = \frac{2\sigma_p^2 (Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2} = \frac{2(15^2)(1.96 + 0.84)^2}{5^2} \approx 141.12$$ $\rightarrow$ Cần 142 người/nhóm $\times$ 2 nhóm = Tổng 284 người.
2. Nếu dùng Thiết kế Chéo (Crossover): Giả sử có tương quan $\rho = 0.4$ giữa 2 lần đo. $$n_{\text{tổng}} = \frac{2(15^2)(1 - 0.4)(1.96 + 0.84)^2}{5^2} = \frac{2(225)(0.6)(7.84)}{25} \approx 84.67$$ $\rightarrow$ Cần Tổng 86 người (43 người/nhóm trình tự).
Kết luận: Thiết kế chéo chỉ cần 86 bệnh nhân, so với 284 của thiết kế song song, để đạt cùng một công suất.
Khi kết quả là nhị phân (ví dụ: có/không có triệu chứng), phân tích dựa trên kiểm định McNemar và tập trung vào các cặp bất đồng (discordant pairs):
Công thức tính tổng cỡ mẫu $n$ (theo Chow et al., 2008) là:
$$n = \frac{\left( Z_{\alpha/2}\sqrt{p_{10} + p_{01}} + Z_{\beta}\sqrt{p_{10} + p_{01} - (p_{10} - p_{01})^2} \right)^2}{(p_{10} - p_{01})^2}$$
Việc ước tính $p_{10}$ và $p_{01}$ (tỷ lệ bất đồng) thường khó hơn so với việc ước tính $\sigma_d$ và đòi hỏi nghiên cứu thí điểm.
Tóm tắt: - Thiết kế chéo cực kỳ hiệu quả về cỡ mẫu. - Chỉ dùng cho bệnh mạn tính, ổn định và can thiệp không chữa khỏi. - Phải có giai đoạn "rửa trôi" (washout) đủ dài để tránh "hiệu ứng tồn dư". - Phân tích dựa trên kiểm định bắt cặp (paired test). - Luôn ngẫu nhiên hóa thứ tự (A-B vs B-A) để kiểm soát "Hiệu ứng Giai đoạn".