From a8896e90e0b633f4acd8b9c712ec0a9761d8044a Mon Sep 17 00:00:00 2001 From: admin Date: Wed, 22 Oct 2025 06:20:05 +0700 Subject: [PATCH] add Commit --- SH/redis/flush.sh | 20 ++ SH/redis/flush_redis_service.sh | 20 ++ sample_size_site_full/adv_crossover.html | 12 +- .../adv_crossover_guide.html | 214 ++++++++++++++- sample_size_site_full/adv_equivalence.html | Bin 266 -> 270 bytes sample_size_site_full/adv_multilevel.html | 12 +- .../adv_multilevel_guide.html | 247 +++++++++++++++++- sample_size_site_full/epi_casecontrol.html | 12 +- .../epi_casecontrol_guide.html | 216 ++++++++++++++- sample_size_site_full/epi_clinical_trial.html | 12 +- .../epi_clinical_trial_guide.html | 73 +++++- sample_size_site_full/epi_cluster.html | 12 +- sample_size_site_full/epi_cluster_guide.html | 103 +++++++- sample_size_site_full/epi_cohort.html | 12 +- sample_size_site_full/epi_cohort_guide.html | 223 +++++++++++++++- sample_size_site_full/overview.html | 25 +- 16 files changed, 1107 insertions(+), 106 deletions(-) create mode 100644 SH/redis/flush.sh create mode 100644 SH/redis/flush_redis_service.sh diff --git a/SH/redis/flush.sh b/SH/redis/flush.sh new file mode 100644 index 0000000..a47ea76 --- /dev/null +++ b/SH/redis/flush.sh @@ -0,0 +1,20 @@ +#!/bin/bash +# Script chay nhu dich vu de xoa Redis cache moi 2 phut +# CẢNH BÁO: CHỈ DÙNG ĐỂ TEST KHẨN CẤP. SẼ ĐĂNG XUẤT TOÀN BỘ USER. + +# Tim duong dan chinh xac cua redis-cli +REDIS_CLI_PATH=$(which redis-cli) + +if [ -z "$REDIS_CLI_PATH" ]; then + logger -t redis-flusher "LOI: Khong tim thay redis-cli. Thoat." + exit 1 +fi + +while true +do + logger -t redis-flusher "Thuc hien FLUSHALL..." + $REDIS_CLI_PATH FLUSHALL + + # Doi 120 giay (2 phut) + sleep 120 +done diff --git a/SH/redis/flush_redis_service.sh b/SH/redis/flush_redis_service.sh new file mode 100644 index 0000000..a47ea76 --- /dev/null +++ b/SH/redis/flush_redis_service.sh @@ -0,0 +1,20 @@ +#!/bin/bash +# Script chay nhu dich vu de xoa Redis cache moi 2 phut +# CẢNH BÁO: CHỈ DÙNG ĐỂ TEST KHẨN CẤP. SẼ ĐĂNG XUẤT TOÀN BỘ USER. + +# Tim duong dan chinh xac cua redis-cli +REDIS_CLI_PATH=$(which redis-cli) + +if [ -z "$REDIS_CLI_PATH" ]; then + logger -t redis-flusher "LOI: Khong tim thay redis-cli. Thoat." + exit 1 +fi + +while true +do + logger -t redis-flusher "Thuc hien FLUSHALL..." + $REDIS_CLI_PATH FLUSHALL + + # Doi 120 giay (2 phut) + sleep 120 +done diff --git a/sample_size_site_full/adv_crossover.html b/sample_size_site_full/adv_crossover.html index 63770de..0d910ab 100644 --- a/sample_size_site_full/adv_crossover.html +++ b/sample_size_site_full/adv_crossover.html @@ -1,11 +1 @@ - - - - - adv_crossover.html - - -

adv_crossover.html

-

This is a placeholder page for Adv Crossover module.

- - + diff --git a/sample_size_site_full/adv_crossover_guide.html b/sample_size_site_full/adv_crossover_guide.html index eb9655c..c13c7cb 100644 --- a/sample_size_site_full/adv_crossover_guide.html +++ b/sample_size_site_full/adv_crossover_guide.html @@ -1,11 +1,213 @@ - + - - adv_crossover_guide.html + + Tính cỡ mẫu cho Thiết kế Chéo (Crossover Design) + + + + + + -

adv_crossover_guide.html

-

This is a placeholder guide page for Adv Crossover Guide.

+
+

Tính cỡ mẫu cho Thiết kế Chéo (Crossover Design)

+ +

+ Thiết kế chéo (Crossover Design) là một loại thiết kế nghiên cứu can thiệp + vô cùng hiệu quả. Trong thiết kế này, mỗi người tham gia sẽ lần lượt nhận + TẤT CẢ các can thiệp (ví dụ: đầu tiên dùng thuốc A, sau đó dùng thuốc B). +

+

+ Ưu điểm lớn nhất là mỗi bệnh nhân tự làm đối chứng cho chính mình. + Điều này giúp loại bỏ "biến thiên giữa các cá nhân" (inter-patient variability) - + vốn là nguồn "nhiễu" (noise) lớn nhất trong các nghiên cứu song song + (parallel-group trials). +

+ +

1. Nguyên lý chung & Thiết kế 2x2

+

+ Một thiết kế chéo 2x2 (hai can thiệp, hai giai đoạn) điển hình bao gồm: +

+ +

+ Việc ngẫu nhiên hóa thứ tự (sequence) giúp chúng ta kiểm soát một yếu tố + gây nhiễu quan trọng gọi là "hiệu ứng giai đoạn" (period effect), + tức là sự thay đổi tự nhiên của bệnh theo thời gian. +

+ +
+ Ưu điểm: Cần cỡ mẫu nhỏ hơn rất nhiều so với + thiết kế song song để đạt cùng một công suất thống kê. +
+ Nhược điểm: Thời gian nghiên cứu trên mỗi bệnh nhân dài hơn và + có nguy cơ bỏ cuộc (dropout) cao hơn. +
+ +

2. Phạm vi ứng dụng & Điều kiện tiên quyết

+

+ Thiết kế này không thể dùng cho mọi loại bệnh. Nó có các điều kiện áp dụng nghiêm ngặt: +

+ + +

Giai đoạn Rửa trôi (Washout Period)

+

+ Đây là điều kiện bắt buộc. Giữa Giai đoạn 1 và Giai đoạn 2, + phải có một giai đoạn "rửa trôi" đủ dài để đảm bảo tác dụng của can thiệp đầu tiên + đã biến mất hoàn toàn trước khi bắt đầu can thiệp thứ hai. +

+

+ Nếu giai đoạn này quá ngắn, "hiệu ứng tồn dư" (carryover effect) + sẽ xảy ra, làm sai lệch kết quả của Giai đoạn 2 và khiến phân tích trở nên vô nghĩa. +

+ +

3. Cỡ mẫu (Biến Liên tục - So sánh 2 Trung bình)

+

+ Đây là trường hợp phổ biến nhất, ví dụ so sánh mức giảm huyết áp, nồng độ HbA1c, v.v. + Vì mỗi bệnh nhân ($i$) có hai kết quả ($\text{Giá_trị}_{i,A}$ và $\text{Giá_trị}_{i,B}$), + chúng ta phân tích dựa trên hiệu số bên trong từng bệnh nhân: + $$d_i = \text{Giá_trị}_{i,A} - \text{Giá_trị}_{i,B}$$ +

+

+ Bài toán trở thành kiểm định T-test một mẫu (one-sample t-test) + để xem trung bình của các hiệu số ($\mu_d$) có khác 0 hay không. + Công thức tính tổng cỡ mẫu $n$ là: +

+

+ $$n = \frac{\sigma_d^2 (Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2}$$ +

+ + +

4. Liên hệ với Thiết kế Song song (Cách dùng thực tế)

+

+ Tham số $\sigma_d$ (Độ lệch chuẩn của hiệu số) rất khó tìm trong y văn. Thay vào đó, + chúng ta thường tìm được $\sigma_p$ (Độ lệch chuẩn "chung" từ nghiên cứu song song) + và $\rho$ (Hệ số tương quan giữa 2 lần đo trên cùng một bệnh nhân). +

+

+ Chúng có mối liên hệ qua công thức: +

+

+ $$\sigma_d^2 = 2\sigma_p^2 (1-\rho)$$ +

+

+ Thay vào công thức cỡ mẫu ở trên, ta có công thức thực tế hơn: +

+

+ $$n = \frac{2\sigma_p^2 (1-\rho) (Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2}$$ +

+ +
+ Ví dụ so sánh hiệu quả: +

+ So sánh 2 thuốc hạ huyết áp (A vs B) với các tham số: + $\Delta = 5 \text{ mmHg}$, $\sigma_p = 15 \text{ mmHg}$ + (độ lệch chuẩn chung), $\alpha=0.05$, power=80%. +

+

+ 1. Nếu dùng Thiết kế Song song (Parallel): + $$n_{\text{mỗi nhóm}} = \frac{2\sigma_p^2 (Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2} + = \frac{2(15^2)(1.96 + 0.84)^2}{5^2} \approx 141.12$$ + $\rightarrow$ Cần 142 người/nhóm $\times$ 2 nhóm = Tổng 284 người. +

+

+ 2. Nếu dùng Thiết kế Chéo (Crossover): + Giả sử có tương quan $\rho = 0.4$ giữa 2 lần đo. + $$n_{\text{tổng}} = \frac{2(15^2)(1 - 0.4)(1.96 + 0.84)^2}{5^2} + = \frac{2(225)(0.6)(7.84)}{25} \approx 84.67$$ + $\rightarrow$ Cần Tổng 86 người (43 người/nhóm trình tự). +

+

+ Kết luận: Thiết kế chéo chỉ cần 86 bệnh nhân, + so với 284 của thiết kế song song, để đạt cùng một công suất. +

+
+ +

5. Cỡ mẫu (Biến Nhị phân - So sánh 2 Tỷ lệ)

+

+ Khi kết quả là nhị phân (ví dụ: có/không có triệu chứng), + phân tích dựa trên kiểm định McNemar và + tập trung vào các cặp bất đồng (discordant pairs): +

+ +

+ Công thức tính tổng cỡ mẫu $n$ (theo Chow et al., 2008) là: +

+

+ $$n = \frac{\left( Z_{\alpha/2}\sqrt{p_{10} + p_{01}} + Z_{\beta}\sqrt{p_{10} + p_{01} - (p_{10} - p_{01})^2} \right)^2}{(p_{10} - p_{01})^2}$$ +

+

Việc ước tính $p_{10}$ và $p_{01}$ (tỷ lệ bất đồng) thường khó hơn + so với việc ước tính $\sigma_d$ và đòi hỏi nghiên cứu thí điểm.

+ +
+

+ Tóm tắt: + - Thiết kế chéo cực kỳ hiệu quả về cỡ mẫu. + - Chỉ dùng cho bệnh mạn tính, ổn định và can thiệp không chữa khỏi. + - Phải có giai đoạn "rửa trôi" (washout) đủ dài để tránh "hiệu ứng tồn dư". + - Phân tích dựa trên kiểm định bắt cặp (paired test). + - Luôn ngẫu nhiên hóa thứ tự (A-B vs B-A) để kiểm soát "Hiệu ứng Giai đoạn". +

+
+ + - + \ No newline at end of file diff --git a/sample_size_site_full/adv_equivalence.html b/sample_size_site_full/adv_equivalence.html index b661194019883f4bfcb66a797215a4c8a7025916..f984ae8384ce1bfbf9a4e2a1c79f1048a8701b7e 100644 GIT binary patch delta 35 ncmeBT>SLNvFPX@Y!cfK#&ydVe#E{QW421bWekw!J#3^L}qSFar delta 31 mcmeBU>SCHuFPh3w$WY3V$xz0S$dJR3%89Mi~Huod|LO diff --git a/sample_size_site_full/adv_multilevel.html b/sample_size_site_full/adv_multilevel.html index 7442e26..561d3c4 100644 --- a/sample_size_site_full/adv_multilevel.html +++ b/sample_size_site_full/adv_multilevel.html @@ -1,11 +1 @@ - - - - - adv_multilevel.html - - -

adv_multilevel.html

-

This is a placeholder page for Adv Multilevel module.

- - + diff --git a/sample_size_site_full/adv_multilevel_guide.html b/sample_size_site_full/adv_multilevel_guide.html index 3da8978..fb92141 100644 --- a/sample_size_site_full/adv_multilevel_guide.html +++ b/sample_size_site_full/adv_multilevel_guide.html @@ -1,11 +1,246 @@ - + - - adv_multilevel_guide.html + + Hướng dẫn về Mô hình Đa cấp (Multilevel Models) + + + + + + -

adv_multilevel_guide.html

-

This is a placeholder guide page for Adv Multilevel Guide.

+
+

Giới thiệu về Mô hình Đa cấp (Multilevel Models - MLM)

+ +

+ Trong thực tế, dữ liệu thường được tổ chức theo cấu trúc phân cấp (hierarchical) + hay lồng ghép (nested). Ví dụ, trong y tế công cộng, dữ liệu + về bệnh nhân (cấp 1) được lồng trong các bệnh viện (cấp 2), và các bệnh viện + lại được lồng trong các tỉnh thành (cấp 3). +

+

+ Vấn đề cốt lõi là: các cá nhân trong cùng một nhóm (ví dụ: bệnh nhân cùng một bệnh viện, + học sinh cùng một lớp học) thường có xu hướng giống nhau hơn + so với các cá nhân từ các nhóm khác. +

+ +
+ Vi phạm Giả định Cốt lõi: +

+ Sự tương đồng này vi phạm giả định quan trọng nhất của hồi quy cổ điển + (như OLS): tính độc lập của các quan sát. +

+

+ Nếu chúng ta bỏ qua cấu trúc lồng ghép này (ví dụ, "gộp" tất cả bệnh nhân lại + và chạy một mô hình hồi quy đơn giản), chúng ta sẽ đánh giá thấp + (underestimate) các sai số chuẩn. Điều này dẫn đến tăng nguy cơ + mắc sai lầm loại I (bác bỏ H0 sai, hay "false positive"), + nghĩa là chúng ta kết luận can thiệp có hiệu quả trong khi thực tế là không. +

+
+ +

1. Nguyên lý chung & Cấu trúc Dữ liệu

+

+ Mô hình Đa cấp (MLM), hay còn gọi là Mô hình Hỗn hợp (Mixed-Effects Models), + được thiết kế để giải quyết vấn đề này. Nó phân tích đồng thời sự biến thiên + ở nhiều cấp độ. +

+
    +
  • + Cấp 1 (Level 1): Cấp độ cá nhân (ví dụ: học sinh, bệnh nhân, người dân). + Đây là nơi chúng ta đo lường kết quả (outcome). +
  • +
  • + Cấp 2 (Level 2): Cấp độ nhóm/cụm (ví dụ: lớp học, bệnh viện, xã/phường). + Các cá nhân ở Cấp 1 được lồng trong các đơn vị ở Cấp 2. +
  • +
  • + Cấp 3 (Level 3)...: Mô hình có thể mở rộng cho nhiều cấp + (ví dụ: lớp học lồng trong trường học, trường học lồng trong quận/huyện). +
  • +
+

+ Mục tiêu của MLM là tách bạch phương sai (sự biến thiên) của kết quả thành: +

+
    +
  • Phương sai bên trong nhóm (within-group variance): Sự khác biệt giữa các cá nhân trong cùng một nhóm.
  • +
  • Phương sai giữa các nhóm (between-group variance): Sự khác biệt trung bình giữa các nhóm với nhau.
  • +
+ +

2. Mô hình & Khái niệm Cốt lõi

+ +

Mô hình Intercept Ngẫu nhiên (Random Intercept Model)

+

+ Đây là dạng MLM đơn giản nhất. Hãy tưởng tượng chúng ta muốn dự đoán kết quả + $Y_{ij}$ (ví dụ: huyết áp) của người $i$ trong bệnh viện $j$. +

+

+ Cấp 1 (Cá nhân): + $$Y_{ij} = \beta_{0j} + \beta_{1}X_{ij} + e_{ij}$$ +

+
    +
  • $Y_{ij}$: Huyết áp của người $i$ ở bệnh viện $j$.
  • +
  • $X_{ij}$: Tuổi của người $i$ ở bệnh viện $j$.
  • +
  • $\beta_{0j}$: Intercept (điểm chặn) riêng của bệnh viện $j$.
  • +
  • $e_{ij}$: Sai số ngẫu nhiên của cá nhân $i$ (phần biến thiên trong nhóm).
  • +
+

+ Cấp 2 (Bệnh viện): + $$\beta_{0j} = \gamma_{00} + u_{0j}$$ +

+
    +
  • $\gamma_{00}$: Intercept trung bình chung của TẤT CẢ các bệnh viện.
  • +
  • $u_{0j}$: Sai số ngẫu nhiên của bệnh viện $j$ (phần biến thiên giữa các nhóm).
  • +
+

+ Kết hợp lại, chúng ta có Mô hình hỗn hợp (Mixed Model): +

+

+ $$Y_{ij} = \underbrace{(\gamma_{00} + \beta_{1}X_{ij})}_{\text{Phần cố định (Fixed Effects)}} + \underbrace{(u_{0j} + e_{ij})}_{\text{Phần ngẫu nhiên (Random Effects)}}$$ +

+ +

Hệ số Tương quan Nội cụm (ICC - $\rho$)

+

+ Từ phần ngẫu nhiên, chúng ta có hai nguồn phương sai: +

+
    +
  • $\sigma^2 = \text{Var}(e_{ij})$: Phương sai bên trong nhóm (Within-group variance).
  • +
  • $\tau_0^2 = \text{Var}(u_{0j})$: Phương sai giữa các nhóm (Between-group variance).
  • +
+

+ Hệ số Tương quan Nội cụm (ICC), ký hiệu là $\rho$, là tỷ lệ phần trăm của + tổng phương sai mà được giải thích bởi sự khác biệt GIỮA các nhóm. +

+

+ $$\rho = ICC = \frac{\tau_0^2}{\tau_0^2 + \sigma^2}$$ +

+

+ Diễn giải: Một ICC = 0.05 (hay 5%) có nghĩa là 5% + sự khác biệt về kết quả (ví dụ: huyết áp) là do sự khác biệt + giữa các bệnh viện, và 95% còn lại là do sự khác biệt giữa các + bệnh nhân trong cùng một bệnh viện. ICC càng cao, các cá nhân trong + cùng một cụm càng giống nhau. +

+ +

3. Cỡ mẫu & Hệ số Thiết kế (Design Effect - DEFF)

+

+ Vì các cá nhân trong cùng một cụm có tương quan (với mức $\rho$), + việc thêm một người mới từ cùng một cụm không cung cấp nhiều thông tin "mới" + bằng việc thêm một người từ một cụm hoàn toàn khác. +

+

+ Do đó, chúng ta cần "lạm phát" (inflate) cỡ mẫu tính toán từ + phương pháp Chọn mẫu Ngẫu nhiên Đơn giản (SRS) + để bù đắp cho sự mất mát thông tin này. + Hệ số lạm phát đó được gọi là Hệ số Thiết kế (Design Effect - DEFF). +

+

+ $$DEFF = 1 + (m - 1) \times \rho$$ +

+
    +
  • $m$: Số cá thể trung bình dự kiến thu thập trong mỗi cụm (ví dụ: 20 bệnh nhân/bệnh viện).
  • +
  • $\rho$: Hệ số tương quan nội cụm (ICC) ước tính từ y văn.
  • +
+

+ Tổng cỡ mẫu cuối cùng bạn cần (đã điều chỉnh cho hiệu ứng cụm) là: +

+

+ $$N_{\text{cluster}} = N_{\text{srs}} \times DEFF$$ +

+
    +
  • $N_{\text{srs}}$: Cỡ mẫu bạn cần nếu dùng Chọn mẫu Ngẫu nhiên Đơn giản (SRS).
  • +
  • $N_{\text{cluster}}$: Tổng cỡ mẫu đã điều chỉnh cho thiết kế cụm.
  • +
+ +
+ Ví dụ Y tế Công cộng (Tính cỡ mẫu): +

+ Bối cảnh: Một nghiên cứu can thiệp cộng đồng nhằm giảm tỷ lệ + suy dinh dưỡng. Tính toán ban đầu (dùng công thức SRS) cho thấy cần + $N_{\text{srs}} = 384$ trẻ. +

+

+ Thiết kế: Nghiên cứu sẽ chọn mẫu theo cụm (chọn ngẫu nhiên các xã, + rồi trong mỗi xã chọn ngẫu nhiên trẻ). + Dự kiến thu thập trung bình $m = 20$ trẻ mỗi xã. + Y văn cho thấy ICC ($\rho$) về tình trạng dinh dưỡng tại các xã là $0.05$. +

+

+ 1. Tính Hệ số Thiết kế (DEFF): + $$DEFF = 1 + (m - 1) \times \rho = 1 + (20 - 1) \times 0.05$$ + $$DEFF = 1 + (19 \times 0.05) = 1 + 0.95 = 1.95$$ + $\rightarrow$ Cỡ mẫu cần phải tăng lên 1.95 lần. +

+

+ 2. Tính Tổng cỡ mẫu đã điều chỉnh (Lý thuyết): + $$N_{\text{cluster}} = N_{\text{srs}} \times DEFF = 384 \times 1.95 = 748.8$$ + $\rightarrow$ Cần khoảng 749 trẻ. +

+

+ 3. Tính số cụm (Số xã) cần thiết: + $$\text{Số cụm (J)} = \frac{N_{\text{cluster}}}{m} = \frac{748.8}{20} = 37.44$$ + $\rightarrow$ Phải làm tròn LÊN, vậy cần 38 xã. +

+

+ 4. Tính Tổng cỡ mẫu Thực tế: + $$N_{\text{final}} = J \times m = 38 \times 20 = 760$$ +

+

+ Kết luận: Thay vì 384 trẻ (nếu dùng SRS), nghiên cứu này + cần thu thập tổng cộng 760 trẻ, được chọn từ + 38 xã khác nhau để đảm bảo đủ công suất thống kê. +

+
+ +
+

+ Tóm tắt: +

+
    +
  • Mô hình Đa cấp (MLM) là bắt buộc khi dữ liệu có cấu trúc lồng ghép (ví dụ: bệnh nhân trong bệnh viện, học sinh trong trường học).
  • +
  • Việc bỏ qua cấu trúc này sẽ dẫn đến sai lầm loại I (kết luận sai).
  • +
  • MLM cho phép phân tích phương sai bên tronggiữa các nhóm.
  • +
  • ICC ($\rho$) đo lường mức độ tương đồng của các cá nhân trong cùng một nhóm.
  • +
  • Khi tính cỡ mẫu cho nghiên cứu cụm, phải sử dụng Hệ số Thiết kế (DEFF) để "lạm phát" cỡ mẫu SRS.
  • +
  • $DEFF = 1 + (m - 1) \times \rho$.
  • +
+ +
+ + - + \ No newline at end of file diff --git a/sample_size_site_full/epi_casecontrol.html b/sample_size_site_full/epi_casecontrol.html index 4a01d8a..03e4f00 100644 --- a/sample_size_site_full/epi_casecontrol.html +++ b/sample_size_site_full/epi_casecontrol.html @@ -1,11 +1 @@ - - - - - epi_casecontrol.html - - -

epi_casecontrol.html

-

This is a placeholder page for Epi Casecontrol module.

- - + diff --git a/sample_size_site_full/epi_casecontrol_guide.html b/sample_size_site_full/epi_casecontrol_guide.html index ff8d81b..cc74b1c 100644 --- a/sample_size_site_full/epi_casecontrol_guide.html +++ b/sample_size_site_full/epi_casecontrol_guide.html @@ -1,11 +1,219 @@ - + - epi_casecontrol_guide.html + Nghiên cứu Bệnh–Chứng (Case-Control Study) + + + -

epi_casecontrol_guide.html

-

This is a placeholder guide page for Epi Casecontrol Guide.

+ +
+

Giới thiệu về Nghiên cứu Bệnh–Chứng (Case–Control Study)

+ +

+ Nghiên cứu Bệnh–Chứng là một loại hình nghiên cứu quan sát và phân tích cơ bản trong dịch tễ học. + Đặc điểm cốt lõi của thiết kế này là hồi cứu (retrospective). +

+ +

+ Thay vì theo dõi một nhóm người theo thời gian để xem ai mắc bệnh (như nghiên cứu Thuần tập – Cohort), + nghiên cứu Bệnh–Chứng bắt đầu bằng việc xác định những người đã mắc bệnh và những người không mắc bệnh, + sau đó nhìn lại quá khứ để so sánh sự khác biệt về phơi nhiễm với một yếu tố nguy cơ nào đó. +

+ +

Các nhóm trong nghiên cứu:

+
    +
  • Nhóm Bệnh (Cases): Gồm những người đã được chẩn đoán mắc bệnh hoặc có kết cục (outcome) mà chúng ta quan tâm.
  • +
  • Nhóm Chứng (Controls): Gồm những người không mắc bệnh, được chọn từ cùng một quần thể nguồn (source population) với nhóm Bệnh.
  • +
+ +

+ Mục tiêu chính là so sánh tỷ lệ (hay đúng hơn là “tỷ suất” – odds) đã từng phơi nhiễm với yếu tố nguy cơ trong quá khứ giữa hai nhóm này. +

+ +

Thước đo chính: Tỷ số chênh (Odds Ratio – OR)

+

+ Thước đo kết hợp chính trong nghiên cứu Bệnh–Chứng là Tỷ số chênh (OR). + Nó cho biết tỷ lệ phơi nhiễm ở nhóm Bệnh cao hơn (hoặc thấp hơn) gấp bao nhiêu lần so với tỷ lệ phơi nhiễm ở nhóm Chứng. +

+ +

Dựa trên bảng 2x2 kinh điển:

+ + + + + + + + + + + + + + + + + +
Bệnh (Cases)Chứng (Controls)
Phơi nhiễm (+)ab
Phơi nhiễm (–)cd
+ +

Công thức tính Tỷ số chênh (OR):

+
+ $$ OR = \frac{\text{Odds phơi nhiễm ở nhóm Bệnh}}{\text{Odds phơi nhiễm ở nhóm Chứng}} + = \frac{(a/c)}{(b/d)} = \frac{a \times d}{b \times c} $$ +
+ +
+ +

Tính Cỡ Mẫu cho Nghiên cứu Bệnh–Chứng

+ +

+ Việc tính toán cỡ mẫu trước khi thực hiện là tối quan trọng để đảm bảo nghiên cứu có đủ + lực mẫu thống kê (statistical power) — tức là có khả năng phát hiện được mối liên quan + (ví dụ, một giá trị OR cụ thể) nếu nó thực sự tồn tại trong quần thể, với một mức ý nghĩa (α) nhất định. +

+ +

Các tham số cần thiết:

+
    +
  • \( \alpha \) (Mức ý nghĩa): Thường là 0.05 (cho độ tin cậy 95%).
  • +
  • \( 1 - \beta \) (Lực mẫu – Power): Thường là 0.80 hoặc 0.90.
  • +
  • \( p_0 \): Tỷ lệ phơi nhiễm ở nhóm Chứng (lấy từ y văn hoặc nghiên cứu trước).
  • +
  • \( OR \): Tỷ số chênh nhỏ nhất có ý nghĩa lâm sàng cần phát hiện.
  • +
  • \( r \): Tỷ lệ số người Chứng / Bệnh (ví dụ: \( r=1 \) cho 1:1, \( r=2 \) cho 2:1).
  • +
+ +

Công thức tính (Theo Schlesselman, 1982)

+ +

Bước 1 – Tính tỷ lệ phơi nhiễm kỳ vọng ở nhóm Bệnh (\(p_1\))

+
+ $$ p_1 = \frac{OR \times p_0}{1 - p_0 + (OR \times p_0)} $$ +
+ +

Bước 2 – Tính tỷ lệ phơi nhiễm trung bình có trọng số (\(\bar{p}\))

+
+ $$ \bar{p} = \frac{p_1 + r \cdot p_0}{1 + r}, \quad \bar{q} = 1 - \bar{p} $$ +
+ +

Bước 3 – Tính cỡ mẫu nhóm Bệnh (\(n_1\))

+
+ $$ n_1 = + \frac{\left[ + Z_{\alpha/2} \sqrt{(r+1)\bar{p}\bar{q}} + + Z_{\beta} \sqrt{r p_0 q_0 + p_1 q_1} + \right]^2}{r(p_1 - p_0)^2} $$ +
+ +

Bước 4 – Cỡ mẫu nhóm Chứng và Tổng

+
+ $$ n_2 = n_1 \times r, \quad N = n_1 + n_2 $$ +
+ +
+ +

Ứng dụng trong Y tế Công cộng

+ +

+ Nghiên cứu Bệnh–Chứng là một trong những công cụ hiệu quả và phổ biến nhất trong y tế công cộng nhờ các ưu điểm: + nhanh chóng, ít tốn kémhiệu quả cao. +

+ +

Các ứng dụng chính:

+
    +
  • Nghiên cứu bệnh hiếm: Đặc biệt phù hợp khi bệnh có tỷ lệ mắc rất thấp, như một số loại ung thư hoặc dị tật bẩm sinh.
  • +
  • Điều tra vụ dịch: Khi một vụ ngộ độc thực phẩm xảy ra, việc so sánh nhóm bị bệnh và nhóm không bệnh giúp xác định nguyên nhân nhanh chóng.
  • +
  • Xác định yếu tố nguy cơ: Ví dụ nghiên cứu của Doll & Hill (1950s) đã chứng minh mối liên hệ giữa hút thuốc và ung thư phổi.
  • +
  • Nghiên cứu bệnh có thời gian ủ bệnh dài: Như bệnh do amiăng hoặc phơi nhiễm hóa chất nghề nghiệp.
  • +
+ +

Hạn chế:

+
    +
  • Sai số nhớ lại (Recall bias): Nhóm bệnh có thể nhớ khác nhóm chứng.
  • +
  • Sai số chọn mẫu (Selection bias): Khó chọn nhóm chứng đại diện cho quần thể nguồn.
  • +
  • Không thể tính được tỷ lệ mới mắc (Incidence) hay hiện mắc (Prevalence).
  • +
+
+ diff --git a/sample_size_site_full/epi_clinical_trial.html b/sample_size_site_full/epi_clinical_trial.html index 354cbbc..fa0dedc 100644 --- a/sample_size_site_full/epi_clinical_trial.html +++ b/sample_size_site_full/epi_clinical_trial.html @@ -1,11 +1 @@ - - - - - epi_clinical_trial.html - - -

epi_clinical_trial.html

-

This is a placeholder page for Epi Clinical Trial module.

- - + diff --git a/sample_size_site_full/epi_clinical_trial_guide.html b/sample_size_site_full/epi_clinical_trial_guide.html index ff21bde..aad8dcd 100644 --- a/sample_size_site_full/epi_clinical_trial_guide.html +++ b/sample_size_site_full/epi_clinical_trial_guide.html @@ -1,11 +1,74 @@ - + - - epi_clinical_trial_guide.html + + +Thử nghiệm lâm sàng - Tính cỡ mẫu + + -

epi_clinical_trial_guide.html

-

This is a placeholder guide page for Epi Clinical Trial Guide.

+ +

Thử nghiệm lâm sàng (Clinical Trial) - Hướng dẫn tính cỡ mẫu

+ +

Thử nghiệm lâm sàng là nghiên cứu can thiệp, trong đó các đối tượng được phân nhóm ngẫu nhiên vào nhóm điều trị hoặc nhóm kiểm soát, và kết quả được theo dõi để đánh giá hiệu quả của can thiệp.

+ +

Công thức tính cỡ mẫu cho so sánh 2 tỷ lệ

+ +

Giả sử bạn muốn so sánh tỷ lệ kết cục (outcome) giữa 2 nhóm, cỡ mẫu cho mỗi nhóm được tính bằng công thức sau:

+ +
+$$ +n = \frac{\left[ Z_{1-\alpha/2} \sqrt{2 \bar{p} \bar{q}} + Z_{1-\beta} \sqrt{p_1 q_1 + p_2 q_2} \right]^2}{(p_1 - p_2)^2} +$$ +
+ +

Trong đó:

+ + +

Ví dụ trong Y tế công cộng

+

Một nhà nghiên cứu muốn đánh giá hiệu quả của vaccine cúm mới. Giả định:

+ + +

Áp dụng công thức trên:

+ + +

Diễn giải

+

Để thử nghiệm có đủ sức mạnh thống kê phát hiện sự khác biệt giữa nhóm vaccine và nhóm không vaccine, cần ít nhất 300 người mỗi nhóm, tổng 600 người.

+ +

Ứng dụng trong y tế công cộng

+ + diff --git a/sample_size_site_full/epi_cluster.html b/sample_size_site_full/epi_cluster.html index 1a9a155..ea32f17 100644 --- a/sample_size_site_full/epi_cluster.html +++ b/sample_size_site_full/epi_cluster.html @@ -1,11 +1 @@ - - - - - epi_cluster.html - - -

epi_cluster.html

-

This is a placeholder page for Epi Cluster module.

- - + diff --git a/sample_size_site_full/epi_cluster_guide.html b/sample_size_site_full/epi_cluster_guide.html index 26c3a79..ad557fd 100644 --- a/sample_size_site_full/epi_cluster_guide.html +++ b/sample_size_site_full/epi_cluster_guide.html @@ -1,11 +1,104 @@ - + - - epi_cluster_guide.html + + +Thiết kế cụm - Tính cỡ mẫu + + -

epi_cluster_guide.html

-

This is a placeholder guide page for Epi Cluster Guide.

+ +

Thiết kế nghiên cứu theo cụm (Cluster Randomized Trial) - Tính cỡ mẫu

+ +

Trong thiết kế nghiên cứu theo cụm, các đơn vị (cụm) như trường học, cộng đồng, hoặc phòng khám được phân nhóm ngẫu nhiên thành nhóm can thiệp hoặc nhóm kiểm soát, thay vì từng cá nhân riêng lẻ. Điều này giúp giảm nhiễu do tương tác giữa các cá nhân trong cùng cụm và thuận tiện trong các can thiệp cộng đồng.

+ +

Công thức tính cỡ mẫu cho so sánh 2 tỷ lệ theo cụm

+ +

Khi thiết kế nghiên cứu cụm, cần điều chỉnh cỡ mẫu bằng **hệ số hiệu quả cụm (Design Effect, DE)** để bù cho sự tương đồng giữa các cá nhân trong cùng cụm:

+ +
+$$ +n_\text{cá nhân} = n_\text{cá nhân bình thường} \times DE +$$ +$$ +DE = 1 + (m - 1) \rho +$$ +
+ +

Trong đó:

+ + +

Công thức cơ bản cho so sánh 2 tỷ lệ (trước điều chỉnh DE)

+
+$$ +n_\text{bình thường} = \frac{\left[ Z_{1-\alpha/2} \sqrt{2 \bar{p} \bar{q}} + Z_{1-\beta} \sqrt{p_1 q_1 + p_2 q_2} \right]^2}{(p_1 - p_2)^2} +$$ +
+ +

Trong đó:

+ + +

Ví dụ trong Y tế công cộng

+

Một nghiên cứu muốn đánh giá chương trình giáo dục sức khỏe ở các trường học nhằm giảm tỷ lệ béo phì học sinh. Giả định:

+ + +

Tính cỡ mẫu cá nhân bình thường:

+
+$$ +n_\text{bình thường} \approx 900 +$$ +
+ +

Điều chỉnh cho thiết kế cụm:

+
+$$ +DE = 1 + (50 - 1) \times 0.01 = 1.49 +$$ +$$ +n_\text{cá nhân} = 900 \times 1.49 \approx 1341 +$$ +
+ +

Tổng số cụm cần: k = n_\text{cá nhân} / m ≈ 1341 / 50 ≈ 27 cụm (mỗi nhóm 13-14 trường)

+ +

Diễn giải

+

Để thử nghiệm có đủ sức mạnh thống kê, cần khoảng 1341 học sinh, chia thành 27 trường, đảm bảo số lượng học sinh trong mỗi trường như dự kiến. Thiết kế cụm giúp giảm nhiễu do tương tác giữa học sinh cùng trường.

+ +

Ứng dụng trong y tế công cộng

+ + diff --git a/sample_size_site_full/epi_cohort.html b/sample_size_site_full/epi_cohort.html index 7feb6ba..ab9e819 100644 --- a/sample_size_site_full/epi_cohort.html +++ b/sample_size_site_full/epi_cohort.html @@ -1,11 +1 @@ - - - - - epi_cohort.html - - -

epi_cohort.html

-

This is a placeholder page for Epi Cohort module.

- - + diff --git a/sample_size_site_full/epi_cohort_guide.html b/sample_size_site_full/epi_cohort_guide.html index 3893e58..2b4cc6a 100644 --- a/sample_size_site_full/epi_cohort_guide.html +++ b/sample_size_site_full/epi_cohort_guide.html @@ -1,11 +1,226 @@ - + - epi_cohort_guide.html + Nghiên cứu Thuần tập (Cohort Study) + + + -

epi_cohort_guide.html

-

This is a placeholder guide page for Epi Cohort Guide.

+ +
+

Giới thiệu về Nghiên cứu Thuần tập (Cohort Study)

+ +

+ Nghiên cứu Thuần tập là một loại hình nghiên cứu quan sát mang tính tiến cứu (prospective) hoặc đôi khi là hồi cứu (retrospective), + được dùng để xác định mối quan hệ giữa phơi nhiễm và bệnh tật theo thời gian. +

+ +

+ Nhà nghiên cứu bắt đầu với một nhóm người chưa mắc bệnh, chia họ thành hai (hoặc nhiều) nhóm dựa trên tình trạng phơi nhiễm với một yếu tố nguy cơ, + sau đó theo dõi qua thời gian để xem ai phát triển bệnh (outcome) và ai không. +

+ +

Các nhóm trong nghiên cứu:

+
    +
  • Nhóm phơi nhiễm (+): Gồm những người có tiếp xúc hoặc chịu tác động của yếu tố nguy cơ.
  • +
  • Nhóm không phơi nhiễm (–): Gồm những người không tiếp xúc với yếu tố nguy cơ đó.
  • +
+ +

+ Mục tiêu chính là so sánh nguy cơ mắc bệnh hoặc tỷ lệ mới mắc giữa hai nhóm. +

+ +

Thước đo chính: Tỷ số nguy cơ (Risk Ratio – RR)

+

+ Tỷ số nguy cơ (RR) cho biết xác suất mắc bệnh ở nhóm phơi nhiễm cao hơn (hoặc thấp hơn) bao nhiêu lần so với nhóm không phơi nhiễm. +

+ +

Dựa trên bảng 2x2:

+ + + + + + + + + + + + + + + + + +
Bệnh (+)Bệnh (–)
Phơi nhiễm (+)ab
Phơi nhiễm (–)cd
+ +

Công thức tính Tỷ số nguy cơ (RR):

+
+ $$ RR = \frac{\text{Nguy cơ ở nhóm phơi nhiễm}}{\text{Nguy cơ ở nhóm không phơi nhiễm}} + = \frac{a / (a + b)}{c / (c + d)} $$ +
+ +

Nếu \( RR = 1 \): không có mối liên quan.
+ Nếu \( RR > 1 \): phơi nhiễm làm tăng nguy cơ bệnh.
+ Nếu \( RR < 1 \): phơi nhiễm có tác dụng bảo vệ.

+ +
+ +

Tính Cỡ Mẫu cho Nghiên cứu Thuần tập

+ +

+ Việc xác định cỡ mẫu thích hợp đảm bảo rằng nghiên cứu có đủ lực thống kê (statistical power) + để phát hiện sự khác biệt thật sự về nguy cơ mắc bệnh giữa nhóm phơi nhiễm và không phơi nhiễm, + với mức ý nghĩa (α) xác định. +

+ +

Các tham số cần thiết:

+
    +
  • \( \alpha \) (Mức ý nghĩa): thường là 0.05 (độ tin cậy 95%).
  • +
  • \( 1 - \beta \) (Lực mẫu – Power): thường là 0.80 hoặc 0.90.
  • +
  • \( p_0 \): Tỷ lệ mắc bệnh ở nhóm không phơi nhiễm.
  • +
  • \( p_1 \): Tỷ lệ mắc bệnh ở nhóm phơi nhiễm (giả định từ OR hoặc RR dự kiến).
  • +
  • \( r \): Tỷ lệ kích thước nhóm không phơi nhiễm / nhóm phơi nhiễm (ví dụ \(r = 1\) cho 1:1).
  • +
+ +

Công thức tính (Theo Kelsey et al., 1996)

+ +

Bước 1 – Tính các giá trị trung bình:

+
+ $$ \bar{p} = \frac{p_1 + r \cdot p_0}{1 + r}, \quad \bar{q} = 1 - \bar{p} $$ +
+ +

Bước 2 – Tính cỡ mẫu cho nhóm phơi nhiễm (\(n_1\)):

+
+ $$ n_1 = + \frac{ + \left[ + Z_{1 - \alpha/2} \sqrt{(r + 1) \bar{p}\bar{q}} + + Z_{1 - \beta} \sqrt{r p_0 q_0 + p_1 q_1} + \right]^2 + }{ + r (p_1 - p_0)^2 + } $$ +
+ +

Bước 3 – Tính cho nhóm không phơi nhiễm và tổng:

+
+ $$ n_2 = n_1 \times r, \quad N = n_1 + n_2 $$ +
+ +

+ Trong đó \(Z_{1 - \alpha/2}\) và \(Z_{1 - \beta}\) là các giá trị Z tương ứng với mức ý nghĩa và lực mẫu mong muốn. +

+ +
+ +

Ứng dụng trong Y tế Công cộng

+ +

+ Nghiên cứu Thuần tập là thiết kế chuẩn mực để đánh giá nguyên nhân – kết quả + và được xem là tiêu chuẩn vàng trong các nghiên cứu dịch tễ học quan sát. +

+ +

Các ứng dụng chính:

+
    +
  • Ước tính nguy cơ tuyệt đối và tương đối: Cho phép tính trực tiếp tỷ lệ mới mắc (incidence) trong các nhóm.
  • +
  • Nghiên cứu phơi nhiễm phổ biến: Thích hợp cho yếu tố nguy cơ phổ biến (ví dụ: hút thuốc, béo phì, ô nhiễm không khí).
  • +
  • Đánh giá đa kết cục: Một phơi nhiễm có thể được theo dõi cho nhiều bệnh khác nhau.
  • +
  • Đánh giá mối quan hệ thời gian: Vì phơi nhiễm được xác định trước khi bệnh xảy ra.
  • +
+ +

Hạn chế:

+
    +
  • Tốn kém và mất thời gian: Phải theo dõi lâu dài, nhất là với bệnh hiếm.
  • +
  • Nguy cơ mất theo dõi (loss to follow-up): Làm giảm độ chính xác.
  • +
  • Không phù hợp cho bệnh hiếm: Vì cần mẫu rất lớn để quan sát đủ số ca bệnh.
  • +
  • Sai số chọn mẫu và thông tin: Có thể ảnh hưởng đến ước tính RR.
  • +
+ +
+ diff --git a/sample_size_site_full/overview.html b/sample_size_site_full/overview.html index c23b108..971165c 100644 --- a/sample_size_site_full/overview.html +++ b/sample_size_site_full/overview.html @@ -1,4 +1,3 @@ - @@ -45,7 +44,11 @@ margin-bottom: 15px; } strong { - color: #c0392b; + color: #c0392b; /* Giữ màu đỏ cho các thuật ngữ quan trọng */ + } + .strong-primary { + color: #2980b9; /* Màu xanh cho mục tiêu chính/thứ cấp */ + font-weight: bold; } code { font-family: 'Courier New', Courier, monospace; @@ -67,6 +70,9 @@ margin-top: 15px; border-radius: 4px; } + .reason p { + margin-bottom: 10px; /* Điều chỉnh khoảng cách trong box lý do */ + } @@ -86,7 +92,7 @@

Mỗi nghiên cứu khoa học đều nhằm trả lời một hoặc nhiều câu hỏi nghiên cứu, và các câu hỏi này được cụ thể hóa thành các giả thuyết thống kê (ví dụ: giả thuyết H₀ và giả thuyết Hₐ). Để có thể đưa ra kết luận bác bỏ hay không bác bỏ một giả thuyết, chúng ta cần sử dụng các phép kiểm định thống kê tương ứng (ví dụ: kiểm định t, khi bình phương, ANOVA).

-

Do đó, cỡ mẫu của nghiên cứu phải đủ lớn để phép kiểm định thống kê có đủ "năng lực" hay công suất thống kê (1-β) để phát hiện ra một ảnh hưởng (effect size) thực sự tồn tại trong quần thể ở một mức ý nghĩa (α) đã định trước. Nói cách khác, không có sự tách biệt giữa "cỡ mẫu nghiên cứu" và "cỡ mẫu cho kiểm định", chúng là một. Cỡ mẫu nghiên cứu được quyết định bởi yêu cầu của các kiểm định giả thuyết chính.

+

Do đó, cỡ mẫu của nghiên cứu phải đủ lớn để phép kiểm định thống kê có đủ "năng lực" hay công suất thống kê (1-β) để phát hiện ra một ảnh hưởng (effect size) thực sự tồn tại trong quần thể ở một mức ý nghĩa (α) đã định trước. Nói cách khác, không có sự tách biệt giữa "cỡ mẫu nghiên cứu" và "cỡ mẫu cho kiểm định", chúng là một. Cỡ mẫu nghiên cứu được quyết định bởi yêu cầu của các kiểm định giả thuyết chính.


@@ -97,17 +103,16 @@

Trong trường hợp này, quy trình chuẩn mực cần thực hiện như sau:

    -
  1. Xác định các mục tiêu chính: Liệt kê tất cả các giả thuyết thống kê chính yếu mà nghiên cứu cần phải trả lời. Đây là những mục tiêu quan trọng nhất, quyết định sự thành công của nghiên cứu.
  2. -
  3. Tính toán cỡ mẫu riêng lẻ: Thực hiện tính toán cỡ mẫu cho từng giả thuyết chính một cách độc lập.
  4. +
  5. Phân loại mục tiêu: Cần phân biệt rõ ràng giữa mục tiêu chính (primary objectives)mục tiêu thứ cấp (secondary objectives). Mục tiêu chính là những câu hỏi then chốt, quan trọng nhất, quyết định sự thành công và kết luận cốt lõi của nghiên cứu.
  6. +
  7. Tính toán cỡ mẫu riêng lẻ: Thực hiện tính toán cỡ mẫu cho từng giả thuyết thuộc nhóm mục tiêu chính một cách độc lập.
  8. Lựa chọn cỡ mẫu cuối cùng: Cỡ mẫu cuối cùng cho toàn bộ nghiên cứu sẽ là cỡ mẫu lớn nhất trong số các cỡ mẫu đã tính toán ở bước 2.
-

Lý do: Việc lựa chọn cỡ mẫu lớn nhất đảm bảo rằng nghiên cứu có đủ công suất thống kê cho tất cả các phân tích quan trọng. Nếu chọn một cỡ mẫu nhỏ hơn, nghiên cứu có thể có đủ năng lực để trả lời một số câu hỏi, nhưng sẽ không đủ năng lực (underpowered) để đưa ra kết luận đáng tin cậy cho các câu hỏi nghiên cứu khác yêu cầu cỡ mẫu lớn hơn. Điều này giúp tránh được sai lầm loại II (type II error) – không phát hiện được sự khác biệt trong khi nó thực sự tồn tại.

+

Lý do và Diễn giải: Việc lựa chọn cỡ mẫu lớn nhất đảm bảo rằng nghiên cứu có đủ công suất thống kê (ví dụ: 1-β ≥ 80%) cho tất cả các mục tiêu chính.

+

Đối với các mục tiêu thứ cấp (hoặc các phân tích mang tính khám phá - exploratory analysis), nhà nghiên cứu chấp nhận rằng cỡ mẫu này có thể không đủ công suất (underpowered) để phát hiện các khác biệt/mối liên hệ nhỏ hơn. Khi báo cáo kết quả, bất kỳ kết luận nào từ mục tiêu thứ cấp không đạt đủ công suất thống kê cần được diễn giải một cách thận trọng và ghi nhận rõ ràng trong phần "Hạn chế của nghiên cứu" (Limitations).

-
-
+ - -``` \ No newline at end of file + \ No newline at end of file