diff --git a/sample_size_site_full/reg_cox.html b/sample_size_site_full/reg_cox.html
index 13ddbaa..c566379 100644
--- a/sample_size_site_full/reg_cox.html
+++ b/sample_size_site_full/reg_cox.html
@@ -1,11 +1 @@
-
-
-
-
- reg_cox.html
-
-
- reg_cox.html
- This is a placeholder page for Reg Cox module.
-
-
+
diff --git a/sample_size_site_full/reg_cox_guide.html b/sample_size_site_full/reg_cox_guide.html
index bd55e76..1a26c7d 100644
--- a/sample_size_site_full/reg_cox_guide.html
+++ b/sample_size_site_full/reg_cox_guide.html
@@ -1,11 +1,187 @@
-
+
- reg_cox_guide.html
+
+ Hồi quy Cox và Tính cỡ mẫu
+
+
+
+
+
+
+
- reg_cox_guide.html
- This is a placeholder guide page for Reg Cox Guide.
+
+ Hồi quy Cox (Mô hình Tỷ lệ rủi ro Cân xứng)
+
+ 1. Giới thiệu về Hồi quy Cox
+
+ Mô hình hồi quy Cox, hay mô hình tỷ lệ rủi ro cân xứng (Proportional Hazards Model), là công cụ cơ bản trong phân tích sống còn (survival analysis).
+ Mục tiêu là đánh giá mối liên hệ giữa các yếu tố dự báo (ví dụ: phơi nhiễm, điều trị, đặc điểm cá nhân) và thời gian xảy ra biến cố (như tử vong, tái phát bệnh, phục hồi...).
+
+
+ Mô hình Cox là bán tham số (semi-parametric) – nghĩa là không cần giả định về dạng phân phối của thời gian sống, mà chỉ xem xét mối quan hệ giữa biến độc lập và nguy cơ xảy ra biến cố.
+
+
+ Công thức mô hình
+
+ Mô hình Cox biểu diễn hàm rủi ro (hazard function) $h(t)$ tại thời điểm $t$ cho một cá thể có bộ biến dự báo $\mathbf{X} = (X_1, X_2, \dots, X_k)$ như sau:
+
+
+ $$
+ h(t | \mathbf{X}) = h_0(t) \times \exp\left(\sum_{i=1}^{k} \beta_i X_i\right)
+ $$
+
+ Trong đó:
+
+ - $h(t | \mathbf{X})$: Hàm rủi ro tại thời điểm $t$ cho cá thể có các đặc điểm $\mathbf{X}$.
+ - $h_0(t)$: Hàm rủi ro nền (baseline hazard) – phần phi tham số của mô hình.
+ - $\beta_i$: Hệ số hồi quy của từng biến độc lập $X_i$.
+ - $\exp(\beta_i)$: Tỷ số rủi ro (Hazard Ratio, HR) – cho biết mức thay đổi tương đối của rủi ro khi $X_i$ tăng một đơn vị.
+
+
+
+ Diễn giải: Nếu $HR = 1$, biến không ảnh hưởng đến rủi ro;
+ nếu $HR > 1$, biến làm tăng rủi ro;
+ nếu $HR < 1$, biến có tác dụng bảo vệ.
+
+
+ 2. Tính cỡ mẫu cho Hồi quy Cox
+
+ Theo công thức của Schoenfeld (1983), số biến cố cần thiết ($E$) để đạt được công suất mong muốn là:
+
+
+
+ $$
+ E = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2}{p_1 p_2 [\ln(HR)]^2}
+ $$
+
+
+
+ Trong đó:
+
+
+ - $Z_{1-\alpha/2}$: Giá trị Z tương ứng với mức ý nghĩa $\alpha$ (ví dụ: 1.96 khi $\alpha = 0.05$).
+ - $Z_{1-\beta}$: Giá trị Z ứng với công suất mong muốn (ví dụ: 0.84 khi power = 0.8).
+ - $p_1, p_2$: Tỷ lệ của hai nhóm (ví dụ: nhóm phơi nhiễm và không phơi nhiễm).
+ - $HR$: Tỷ số rủi ro kỳ vọng giữa hai nhóm.
+
+
+ Tổng cỡ mẫu cần thiết được ước lượng là:
+
+ $$
+ N = \frac{E}{P_e}
+ $$
+
+ Trong đó $P_e$ là xác suất xảy ra biến cố trong quần thể nghiên cứu (ước tính từ nghiên cứu trước).
+
+ 3. Ứng dụng trong Y tế Công cộng
+
+ Trong nghiên cứu y tế công cộng, mô hình Cox được dùng rộng rãi để:
+
+
+ - Phân tích thời gian sống còn sau điều trị (ví dụ: sau phẫu thuật ung thư).
+ - Đánh giá yếu tố nguy cơ gây tử vong hoặc tái phát bệnh.
+ - So sánh hiệu quả giữa các phương pháp can thiệp trong cùng quần thể.
+ - Dự đoán xác suất sống còn theo nhóm bệnh nhân có đặc điểm khác nhau.
+
+
+
+
Ví dụ thực tế:
+ Một nghiên cứu muốn đánh giá tác động của việc hút thuốc đến nguy cơ tử vong do bệnh tim trong 5 năm.
+ Giả sử:
+
+ - Tỷ lệ hút thuốc trong quần thể là 40% → $p_1 = 0.4$, $p_2 = 0.6$
+ - Tỷ số rủi ro kỳ vọng giữa hai nhóm là $HR = 1.8$
+ - Xác suất tử vong trong 5 năm là $P_e = 0.15$
+ - Mức ý nghĩa $\alpha = 0.05$, công suất 80% → $Z_{1-\alpha/2}=1.96$, $Z_{1-\beta}=0.84$
+
+
+ Khi đó:
+
+ $$
+ E = \frac{(1.96 + 0.84)^2}{(0.4)(0.6)[\ln(1.8)]^2} \approx 125
+ $$
+
+
+ $$
+ N = \frac{125}{0.15} \approx 834
+ $$
+
+
+
+ 👉 Như vậy, cần ít nhất 834 người tham gia (trong đó kỳ vọng có khoảng 125 biến cố tử vong) để có đủ công suất phát hiện tác động của hút thuốc đối với nguy cơ tử vong do bệnh tim.
+
+
+
+
+ Cỡ mẫu hợp lý giúp nghiên cứu phát hiện được mối liên hệ thật (tránh âm tính giả) và giảm lãng phí nguồn lực trong các thử nghiệm can thiệp hoặc theo dõi đoàn hệ.
+
+
diff --git a/sample_size_site_full/reg_linear_multi.html b/sample_size_site_full/reg_linear_multi.html
index 150e423..6ff968e 100644
--- a/sample_size_site_full/reg_linear_multi.html
+++ b/sample_size_site_full/reg_linear_multi.html
@@ -1,11 +1 @@
-
-
-
-
- reg_linear_multi.html
-
-
- reg_linear_multi.html
- This is a placeholder page for Reg Linear Multi module.
-
-
+
diff --git a/sample_size_site_full/reg_linear_multi_guide.html b/sample_size_site_full/reg_linear_multi_guide.html
index 7a05f31..8f1e4c5 100644
--- a/sample_size_site_full/reg_linear_multi_guide.html
+++ b/sample_size_site_full/reg_linear_multi_guide.html
@@ -1,11 +1,219 @@
-
+
-
- reg_linear_multi_guide.html
+
+ Giới thiệu Hồi quy Tuyến tính Đa biến
+
+
+
+
+
+
+
- reg_linear_multi_guide.html
- This is a placeholder guide page for Reg Linear Multi Guide.
+
+
Tìm hiểu về Hồi quy Tuyến tính Đa biến (Multiple Linear Regression)
+
+
1. Hồi quy Tuyến tính Đa biến là gì?
+
+ Hồi quy Tuyến tính Đa biến (MLR) là một kỹ thuật thống kê cơ bản và mạnh mẽ. Nó là phiên bản mở rộng của hồi quy tuyến tính đơn, được sử dụng để kiểm tra và mô hình hóa mối quan hệ giữa một biến phụ thuộc (kết quả) liên tục và nhiều hơn một biến độc lập (yếu tố dự báo).
+
+
+ Mục tiêu chính của MLR là:
+
+
+ - Dự đoán: Dự đoán giá trị của biến phụ thuộc (ví dụ: dự đoán huyết áp) dựa trên một bộ các biến độc lập (ví dụ: tuổi, BMI, lượng natri tiêu thụ).
+ - Giải thích: Hiểu và lượng hóa ảnh hưởng của từng biến độc lập lên biến phụ thuộc, trong khi kiểm soát ảnh hưởng của các biến khác.
+
+
+
2. Công thức Mô hình
+
Công thức toán học tổng quát của mô hình MLR là:
+
+ $$Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_m X_m + \epsilon$$
+
+
Trong đó:
+
+ - \(Y\): Biến phụ thuộc (biến kết quả, ví dụ: huyết áp tâm thu).
+ - \(X_1, X_2, \dots, X_m\): Các biến độc lập (biến dự báo, ví dụ: tuổi, BMI...).
+ - \(\beta_0\): Hệ số chặn (Intercept) - giá trị dự đoán của \(Y\) khi tất cả các biến \(X\) bằng 0.
+ - \(\beta_1, \dots, \beta_m\): Các hệ số hồi quy (Coefficients) - cho biết mức độ thay đổi của \(Y\) khi biến \(X\) tương ứng tăng 1 đơn vị.
+ - \(\epsilon\): Sai số ngẫu nhiên (Residual Error) - phần phương sai của \(Y\) mà mô hình không giải thích được.
+
+
+
3. Hướng dẫn Diễn giải Kết quả
+
+ Phần quan trọng nhất khi sử dụng MLR là diễn giải đúng các hệ số \(\beta\).
+
+
+
+ Diễn giải \(\beta_i\) (Ví dụ \(\beta_1\)): "Khi biến \(X_1\) tăng lên 1 đơn vị, giá trị trung bình của \(Y\) được dự đoán sẽ thay đổi \(\beta_1\) đơn vị, với điều kiện tất cả các biến độc lập khác (\(X_2, \dots, X_m\)) được giữ không đổi."
+
+
+
+ Khả năng "giữ không đổi" các biến khác chính là sức mạnh của MLR, cho phép chúng ta "cô lập" và "điều chỉnh" ảnh hưởng của các yếu tố gây nhiễu (confounders).
+
+
+ - Hệ số xác định ($R^2$): Cho biết mô hình (tất cả các biến $X$ gộp lại) giải thích được bao nhiêu phần trăm (%) phương sai của biến $Y$.
+ - P-value (của từng biến): Cho biết liệu ảnh hưởng của biến $X_i$ đó lên $Y$ có ý nghĩa thống kê hay không (thường so với \(\alpha = 0.05\)).
+
+
+
4. Tính Cỡ mẫu cho Hồi quy Tuyến tính Đa biến
+
+ Để mô hình hồi quy của bạn đáng tin cậy, bạn cần đảm bảo cỡ mẫu (số lượng quan sát, $N$) đủ lớn. Một cỡ mẫu đủ lớn sẽ cung cấp đủ công suất (power) thống kê để phát hiện ra các mối quan hệ có ý nghĩa (tức là $R^2 > 0$).
+
+
+
a. Phương pháp Phân tích Công suất (Power Analysis)
+
+ Đây là phương pháp tiêu chuẩn vàng, được khuyến nghị nhất. Nó yêu cầu bạn phải ước tính trước một số tham số:
+
+
+ - Kích thước ảnh hưởng (Effect Size): Thường được biểu thị bằng $f^2$ của Cohen, được tính từ $R^2$ (Hệ số xác định) mà bạn kỳ vọng mô hình của mình sẽ đạt được (dựa trên các nghiên cứu trước).
+ - Số lượng biến độc lập ($m$): Số biến dự báo trong mô hình của bạn.
+ - Mức ý nghĩa ($\alpha$): Thường là 0.05.
+ - Công suất ($1-\beta$): Thường là 0.80 (80%).
+
+
Công thức chuyển đổi từ $R^2$ sang $f^2$ là:
+
+ $$f^2 = \frac{R^2}{1 - R^2}$$
+
+
Bạn có thể sử dụng các phần mềm chuyên dụng như G*Power hoặc các thư viện (như pwr
trong R) để thực hiện tính toán này.
+
+
b. Các Quy tắc Kinh nghiệm (Rules of Thumb)
+
+ Khi khó ước tính $R^2$, các nhà nghiên cứu đôi khi dùng các quy tắc kinh nghiệm để ước tính nhanh. Tuy nhiên, hãy thận trọng khi sử dụng chúng.
+
+
+
+ - Quy tắc của Green (1991) (để kiểm định $R^2$): $N \ge 50 + 8m$
+ (Ví dụ: với $m=4$ biến, bạn cần $N \ge 50 + 8*4 = 82$ quan sát).
+ - Quy tắc của Green (1991) (để kiểm định từng $\beta_i$): $N \ge 104 + m$
+ (Ví dụ: với $m=4$ biến, bạn cần $N \ge 104 + 4 = 108$ quan sát).
+ - Quy tắc "10-20 quan sát mỗi biến": Một quy tắc rất đơn giản là $N \ge 10 \times m$. (Ví dụ: $m=4$ biến, cần ít nhất 40 quan sát). Quy tắc này thường bị coi là quá yếu.
+
+
+
Khuyến nghị: Luôn ưu tiên phương pháp Phân tích Công suất (mục a) vì nó cung cấp ước tính cỡ mẫu chính xác và có cơ sở lý luận vững chắc hơn.
+
+
5. Phạm vi ứng dụng trong Y tế Công cộng
+
+ Trong Y tế Công cộng và Dịch tễ học, MLR là một trong những công cụ được sử dụng thường xuyên nhất. Nó đặc biệt hữu ích khi các kết quả sức khỏe (biến $Y$) thường bị ảnh hưởng bởi rất nhiều yếu tố (nhiều biến $X$) cùng một lúc.
+
+
+
Ví dụ 1: Xác định các yếu tố dự báo Huyết áp
+
+ - Mục tiêu: Tìm hiểu các yếu tố ảnh hưởng đến huyết áp tâm thu (HATT).
+ - Biến phụ thuộc (Y): Huyết áp tâm thu (mmHg - liên tục).
+ - Biến độc lập (X):
+
+ - \(X_1\): Tuổi (năm).
+ - \(X_2\): Chỉ số BMI (kg/m²).
+ - \(X_3\): Lượng Natri tiêu thụ hàng ngày (mg).
+ - \(X_4\): Tình trạng hút thuốc (1 = có, 0 = không).
+
+
+ - Ứng dụng: Mô hình có thể cho biết, ví dụ, "Sau khi đã điều chỉnh theo tuổi, BMI và tình trạng hút thuốc, mỗi 100mg Natri tăng thêm hàng ngày làm tăng HATT trung bình 0.5 mmHg (\(\beta_3 = 0.005\))".
+
+
+
Ví dụ 2: Nghiên cứu Cân nặng Trẻ sơ sinh
+
+ - Mục tiêu: Xác định các yếu tố nguy cơ liên quan đến cân nặng sơ sinh thấp.
+ - Biến phụ thuộc (Y): Cân nặng khi sinh của trẻ (gram - liên tục).
+ - Biến độc lập (X):
+
+ - \(X_1\): Tuổi của mẹ.
+ - \(X_2\): Số lần khám thai.
+ - \(X_3\): Mẹ có hút thuốc khi mang thai (1 = có, 0 = không).
+ - \(X_4\): Tình trạng dinh dưỡng của mẹ (ví dụ: tăng cân trong thai kỳ).
+
+
+ - Ứng dụng: Giúp lượng hóa việc hút thuốc (\(X_3\)) làm giảm trung bình bao nhiêu gram cân nặng của trẻ, sau khi đã tính đến ảnh hưởng của tuổi mẹ và số lần khám thai.
+
+
+
Ví dụ 3: Đánh giá Chi phí Y tế
+
+ - Mục tiêu: Dự đoán chi phí điều trị hàng năm cho bệnh nhân tiểu đường.
+ - Biến phụ thuộc (Y): Tổng chi phí y tế trong năm (VNĐ - liên tục).
+ - Biến độc lập (X):
+
+ - \(X_1\): Số lần nhập viện.
+ - \(X_2\): Chỉ số HbA1c trung bình.
+ - \(X_3\): Số lượng bệnh đồng mắc (ví dụ: tim mạch, thận).
+
+
+ - Ứng dụng: Giúp các nhà quản lý y tế dự báo ngân sách và xác định nhóm bệnh nhân nào có nguy cơ phát sinh chi phí cao để can thiệp sớm.
+
+
+
+
+ Kết luận: Hồi quy Tuyến tính Đa biến là một công cụ thiết yếu trong y tế công cộng để dự đoán các kết quả sức khỏe liên tục và hiểu các mối quan hệ phức tạp, đặc biệt là khi cần điều chỉnh các yếu tố gây nhiễu.
+
+
+
+
-
+
\ No newline at end of file
diff --git a/sample_size_site_full/reg_logistic_multi.html b/sample_size_site_full/reg_logistic_multi.html
index 09a822a..9b542a9 100644
--- a/sample_size_site_full/reg_logistic_multi.html
+++ b/sample_size_site_full/reg_logistic_multi.html
@@ -1,11 +1 @@
-
-
-
-
- reg_logistic_multi.html
-
-
- reg_logistic_multi.html
- This is a placeholder page for Reg Logistic Multi module.
-
-
+
diff --git a/sample_size_site_full/reg_logistic_multi_guide.html b/sample_size_site_full/reg_logistic_multi_guide.html
index 9f9182c..f46b166 100644
--- a/sample_size_site_full/reg_logistic_multi_guide.html
+++ b/sample_size_site_full/reg_logistic_multi_guide.html
@@ -1,11 +1,241 @@
-
+
-
- reg_logistic_multi_guide.html
+
+ Giới thiệu Hồi quy Logistic Đa biến
+
+
+
+
+
+
+
- reg_logistic_multi_guide.html
- This is a placeholder guide page for Reg Logistic Multi Guide.
+
+
Tìm hiểu về Hồi quy Logistic Đa biến (Multiple Logistic Regression)
+
+
1. Hồi quy Logistic Đa biến là gì?
+
+ Hồi quy Logistic Đa biến (MLR) là một kỹ thuật thống kê được sử dụng để dự đoán một kết quả nhị phân (binary) hoặc phân loại (categorical) dựa trên nhiều hơn một biến độc lập (yếu tố dự báo).
+
+
+ Không giống như hồi quy tuyến tính (dự đoán một giá trị liên tục như huyết áp), hồi quy logistic dự đoán xác suất (probability) để một "sự kiện" (event) xảy ra, ví dụ: xác suất mắc bệnh (Có/Không), xác suất tái nhập viện (Có/Không).
+
+
+ Mục tiêu chính của MLR là:
+
+
+ - Dự đoán: Ước tính xác suất một cá nhân sẽ thuộc về một nhóm (ví dụ: dự đoán khả năng một bệnh nhân bị bệnh tim).
+ - Giải thích: Hiểu và lượng hóa ảnh hưởng của từng biến độc lập lên khả năng xảy ra của 'event', thường thông qua Tỷ số chênh (Odds Ratios - OR), trong khi kiểm soát ảnh hưởng của các biến khác.
+
+
+
2. Công thức Mô hình
+
Hồi quy logistic không mô hình hóa biến \(Y\) (0 hoặc 1) một cách trực tiếp. Thay vào đó, nó mô hình hóa log-odds (logit) của xác suất \(P\) (xác suất $Y=1$).
+
+ $$ \text{logit}(P) = \ln\left(\frac{P}{1-P}\right) = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_m X_m $$
+
+
Trong đó:
+
+ - \(P\): Xác suất 'event' xảy ra (ví dụ: $P(\text{Bệnh})=1$).
+ - \(\ln\left(\frac{P}{1-P}\right)\): Log-odds (hay "logit") của 'event'. Đây là phần tuyến tính của mô hình.
+ - \(X_1, X_2, \dots, X_m\): Các biến độc lập (ví dụ: tuổi, BMI, hút thuốc).
+ - \(\beta_0\): Hệ số chặn (Log-odds của 'event' khi tất cả các biến \(X\) bằng 0).
+ - \(\beta_1, \dots, \beta_m\): Các hệ số hồi quy (Log-odds thay đổi khi \(X\) tăng 1 đơn vị).
+
+
+
3. Hướng dẫn Diễn giải Kết quả
+
+ Việc diễn giải trực tiếp hệ số \(\beta\) (log-odds) thường không trực quan. Thay vào đó, chúng ta diễn giải Tỷ số chênh (Odds Ratio - OR), được tính bằng cách lấy lũy thừa của \(\beta\).
+
+
+ $$ \text{OR}_i = e^{\beta_i} $$
+
+
+
+ Diễn giải \(\text{OR}_i\) (Ví dụ $e^{\beta_1}$): "Khi biến \(X_1\) tăng lên 1 đơn vị, tỷ số chênh (Odds) của 'event' (\(Y=1\)) xảy ra được dự đoán sẽ thay đổi (nhân) \(e^{\beta_1}\) lần, với điều kiện tất cả các biến độc lập khác (\(X_2, \dots, X_m\)) được giữ không đổi."
+
+
+
+ - Nếu \(\text{OR} > 1\): \(X\) là yếu tố nguy cơ (tăng khả năng 'event').
+ - Nếu \(\text{OR} < 1\): \(X\) là yếu tố bảo vệ (giảm khả năng 'event').
+ - Nếu \(\text{OR} = 1\): \(X\) không ảnh hưởng đến 'event'.
+
+
+ - Pseudo-$R^2$ (Ví dụ: Nagelkerke, McFadden): Chỉ số tương tự $R^2$, cho biết mức độ phù hợp của mô hình (model fit).
+ - P-value (của từng biến): Cho biết liệu ảnh hưởng của biến \(X_i\) đó lên log-odds có ý nghĩa thống kê hay không (thường so với \(\alpha = 0.05\)).
+
+
+
4. Tính Cỡ mẫu cho Hồi quy Logistic Đa biến
+
+ Đối với logistic đa biến, việc tính "công suất" (power) rất phức tạp. Thay vào đó, phương pháp phổ biến nhất là sử dụng các quy tắc kinh nghiệm để đảm bảo sự ổn định (stability) của mô hình và tránh hiện tượng overfitting.
+
+
+
a. Quy tắc "Events Per Variable" (EPV)
+
+ Đây là quy tắc được trích dẫn rộng rãi nhất. Nó không dựa trên công suất mà dựa trên số lượng 'event' (kết quả ít gặp) so với số lượng tham số trong mô hình.
+
+
+ - 'Event' (Sự kiện): Là nhóm kết quả ít phổ biến hơn. Nếu tỉ lệ bệnh là 15% (\(P=0.15\)), thì 'event' là các ca bệnh. Tổng số 'event' trong mẫu là \(N \times 0.15\).
+ - 'Variable' (Tham số - $m$): Đây là số lượng tham số (coefficients) của biến độc lập, không phải số biến.
+
+ - Biến liên tục (Tuổi): $m=1$
+ - Biến nhị phân (Giới tính): $m=1$
+ - Biến phân loại 4 bậc (Hút thuốc): $m=3$ (cần 3 biến giả)
+
+
+
+
+
Quy tắc (Peduzzi, 1996): Cần ít nhất 10 'event' cho mỗi tham số (EPV $\ge$ 10).
+
Nhiều nhà thống kê (như Frank Harrell) khuyến nghị EPV $\ge 15$ hoặc $\ge 20$ để đảm bảo an toàn hơn.
+
+
+
Công thức tính cỡ mẫu $N$ tối thiểu:
+
+ $$ N_{\text{tối thiểu}} = \frac{m \times \text{EPV}}{P_{\text{event}}} $$
+
+
Trong đó:
+
+ - \(m\): Tổng số tham số của các biến độc lập.
+ - \(\text{EPV}\): Quy tắc bạn chọn (ví dụ: 10, 15, hoặc 20).
+ - \(P_{\text{event}}\): Tỉ lệ kỳ vọng của nhóm kết quả ít gặp hơn.
+
+
Ví dụ: Cần 5 tham số ($m=5$), dùng EPV=10, và tỉ lệ bệnh là 20% ($P_{\text{event}}=0.20$):
+
1. Số 'event' cần: $5 \times 10 = 50$ ca bệnh.
+
2. Tổng cỡ mẫu $N$: $50 / 0.20 = 250$ người.
+
+
b. Hậu quả của việc không tuân thủ EPV (EPV quá thấp)
+
+ Sử dụng cỡ mẫu quá nhỏ (EPV < 10) có thể dẫn đến các vấn đề nghiêm trọng:
+
+
+ - Mô hình không hội tụ (convergence failure).
+ - Hiện tượng "Separation": Xảy ra khi một biến dự đoán kết quả một cách hoàn hảo (ví dụ: tất cả người hút thuốc đều bị bệnh), khiến mô hình thất bại.
+ - Ước tính bị chệch (Biased estimates): Các giá trị Odds Ratio (OR) thường bị thổi phồng một cách phi thực tế (ví dụ: OR = 500).
+ - Sai số chuẩn (Standard Errors) lớn và khoảng tin cậy (CI) quá rộng, khiến kết quả vô nghĩa.
+
+
+
5. Phạm vi ứng dụng trong Y tế Công cộng
+
+ Hồi quy Logistic là một trong những mô hình được sử dụng nhiều nhất trong Y tế Công cộng, vì rất nhiều kết quả sức khỏe được quan tâm là dạng nhị phân (Mắc bệnh/Không, Tử vong/Sống, Tái phát/Không).
+
+
+
Ví dụ 1: Xác định các yếu tố nguy cơ của Tăng huyết áp
+
+ - Mục tiêu: Tìm hiểu các yếu tố liên quan đến việc bị tăng huyết áp.
+ - Biến phụ thuộc (Y): Tình trạng Tăng huyết áp (1 = Có, 0 = Không).
+ - Biến độc lập (X):
+
+ - \(X_1\): Tuổi (năm).
+ - \(X_2\): Chỉ số BMI (kg/m²).
+ - \(X_3\): Lượng Natri tiêu thụ hàng ngày (mg).
+ - \(X_4\): Tình trạng hút thuốc (1 = có, 0 = không).
+
+
+ - Ứng dụng: Mô hình có thể cho biết, "Sau khi đã điều chỉnh theo tuổi, BMI và lượng Natri, người hút thuốc có tỷ số chênh (odds) bị tăng huyết áp cao gấp 1.8 lần so với người không hút thuốc (\(OR = 1.8\))".
+
+
+
Ví dụ 2: Nghiên cứu Trẻ nhẹ cân khi sinh
+
+ - Mục tiêu: Xác định các yếu tố nguy cơ dẫn đến sinh con nhẹ cân.
+ - Biến phụ thuộc (Y): Trẻ nhẹ cân (1 = Có, < 2500g; 0 = Không, \(\ge\) 2500g).
+ - Biến độc lập (X):
+
+ - \(X_1\): Tuổi của mẹ.
+ - \(X_2\): Số lần khám thai.
+ - \(X_3\): Mẹ có hút thuốc khi mang thai (1 = có, 0 = không).
+ - \(X_4\): Tình trạng dinh dưỡng của mẹ.
+
+
+ - Ứng dụng: Giúp lượng hóa việc mẹ hút thuốc (\(X_3\)) làm tăng tỷ số chênh (odds) sinh con nhẹ cân lên 2.5 lần (\(OR = 2.5\)), sau khi đã tính đến ảnh hưởng của tuổi mẹ và số lần khám thai.
+
+
+
Ví dụ 3: Dự đoán Tái nhập viện
+
+ - Mục tiêu: Dự đoán khả năng bệnh nhân tiểu đường tái nhập viện trong 30 ngày.
+ - Biến phụ thuộc (Y): Tái nhập viện trong 30 ngày (1 = Có, 0 = Không).
+ - Biến độc lập (X):
+
+ - \(X_1\): Số lần nhập viện trong 12 tháng trước.
+ - \(X_2\): Chỉ số HbA1c.
+ - \(X_3\): Số lượng bệnh đồng mắc.
+ - \(X_4\): Có sử dụng Insulin (1 = Có, 0 = Không).
+
+
+ - Ứng dụng: Xây dựng mô hình tính điểm nguy cơ (risk score) để xác định bệnh nhân nào cần can thiệp, theo dõi sát sao sau khi xuất viện.
+
+
+
+
+ Kết luận: Hồi quy Logistic Đa biến là công cụ cốt lõi trong y tế công cộng để dự đoán nguy cơ (xác suất) của các kết quả sức khỏe nhị phân và lượng hóa ảnh hưởng của các yếu tố (thông qua Odds Ratios) sau khi đã điều chỉnh các yếu tố gây nhiễu.
+
+
+
+
-
+
\ No newline at end of file
diff --git a/sample_size_site_full/reg_poisson.html b/sample_size_site_full/reg_poisson.html
index 8a35b8b..8a5bfc9 100644
--- a/sample_size_site_full/reg_poisson.html
+++ b/sample_size_site_full/reg_poisson.html
@@ -1,11 +1 @@
-
-
-
-
- reg_poisson.html
-
-
- reg_poisson.html
- This is a placeholder page for Reg Poisson module.
-
-
+
diff --git a/sample_size_site_full/reg_poisson_guide.html b/sample_size_site_full/reg_poisson_guide.html
index 325e193..421df0d 100644
--- a/sample_size_site_full/reg_poisson_guide.html
+++ b/sample_size_site_full/reg_poisson_guide.html
@@ -1,11 +1,184 @@
-
+
-
- reg_poisson_guide.html
+
+ Giới thiệu Hồi quy Poisson (Đơn biến)
+
+
+
+
+
+
+
- reg_poisson_guide.html
- This is a placeholder guide page for Reg Poisson Guide.
+
+
Hồi quy Poisson (Poisson Regression – Đơn biến)
+
+
1. Giới thiệu
+
+ Hồi quy Poisson được sử dụng khi biến phụ thuộc là biến đếm
+ (số ca mắc, số lần nhập viện, số tai nạn, số tử vong, v.v.).
+ Mô hình này mô tả số lượng sự kiện trung bình xảy ra trong một khoảng thời gian hoặc không gian nhất định.
+
+
+
2. Mô hình toán học
+
+ Mô hình Poisson giả định rằng:
+
+
+ $$ Y_i \sim \text{Poisson}(\lambda_i) $$
+ $$ \log(\lambda_i) = \beta_0 + \beta_1 X_i $$
+
+
+
Trong đó:
+
+ - \(Y_i\): Số lần xảy ra sự kiện ở quan sát thứ \(i\).
+ - \(\lambda_i\): Giá trị kỳ vọng (mean rate) của số sự kiện.
+ - \(X_i\): Biến độc lập (như nhóm phơi nhiễm, tuổi, giới, v.v.).
+ - \(\beta_0\): Hệ số chặn (log của tỷ suất trung bình khi \(X=0\)).
+ - \(\beta_1\): Hệ số hồi quy, cho biết sự thay đổi log(tỷ suất) khi \(X\) tăng 1 đơn vị.
+
+
+
3. Diễn giải kết quả
+
+ Khi mô hình Poisson được ước lượng, ta thường diễn giải hệ số hồi quy \(\beta_1\) thông qua:
+
+
+ $$ \text{Rate Ratio (RR)} = e^{\beta_1} $$
+
+
+
+ - Nếu \(RR = 1\): Không có khác biệt về tỷ suất sự kiện giữa các nhóm.
+ - Nếu \(RR > 1\): Nhóm có giá trị \(X\) cao hơn có tỷ suất sự kiện cao hơn.
+ - Nếu \(RR < 1\): Nhóm có giá trị \(X\) cao hơn có tỷ suất sự kiện thấp hơn.
+
+
+
+
+ Ví dụ: Nếu \(RR = 1.5\), có nghĩa là nhóm phơi nhiễm có tỷ suất mắc bệnh cao hơn 1.5 lần so với nhóm không phơi nhiễm.
+
+
+
4. Kiểm định giả thuyết
+
+ $$
+ H_0: \beta_1 = 0 \quad \text{(không có mối liên quan)} \\
+ H_a: \beta_1 \neq 0 \quad \text{(có mối liên quan giữa X và tỷ suất sự kiện)}
+ $$
+
+
+ Nếu giá trị p < 0.05, ta bác bỏ \(H_0\) và kết luận rằng có mối liên quan giữa \(X\) và tỷ suất sự kiện.
+
+
+
5. Tính cỡ mẫu
+
+ Việc tính cỡ mẫu trong hồi quy Poisson đơn biến thường dựa trên so sánh hai tỷ suất mắc (incidence rates).
+ Một công thức gần đúng được sử dụng khi muốn kiểm định sự khác biệt giữa hai nhóm có tỷ suất mắc khác nhau:
+
+
+
+ $$
+ n = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2 \times (\lambda_1 + \lambda_2)}
+ {(\lambda_1 - \lambda_2)^2}
+ $$
+
+
+
Trong đó:
+
+ - \(\lambda_1, \lambda_2\): Tỷ suất sự kiện trung bình ở hai nhóm.
+ - \(Z_{1-\alpha/2}\): Giá trị Z tương ứng với mức ý nghĩa (ví dụ: 1.96 cho \(\alpha = 0.05\)).
+ - \(Z_{1-\beta}\): Giá trị Z tương ứng với công suất mong muốn (ví dụ: 0.84 cho power = 0.8).
+
+
+
+ Trong thực tế, khi dữ liệu có thời gian theo dõi khác nhau, cần tính đến thời gian phơi nhiễm
và sử dụng biến offset = log(thời gian quan sát)
để hiệu chỉnh mô hình.
+
+
+
+ Lưu ý: Nếu dữ liệu có phương sai lớn hơn trung bình (overdispersion), cần xem xét sử dụng
+ mô hình Hồi quy Quasi-Poisson hoặc Negative Binomial Regression.
+
+
+
6. Ứng dụng trong Y tế công cộng
+
+ - Phân tích tỷ suất mắc bệnh giữa hai nhóm dân cư (ví dụ: có và không phơi nhiễm).
+ - So sánh số ca bệnh theo các khu vực, năm hoặc nhóm tuổi.
+ - Ước tính tác động của một yếu tố nguy cơ lên số lần xảy ra sự kiện.
+
+
+
+ Ví dụ: Trong nghiên cứu về bệnh lao, hồi quy Poisson có thể dùng để so sánh số ca mắc giữa khu vực đô thị và nông thôn. Nếu mô hình cho \(RR = 2.0\), ta có thể kết luận rằng tỷ suất mắc ở đô thị cao gấp 2 lần so với nông thôn.
+
+
+
+
Kết luận: Hồi quy Poisson đơn biến là công cụ hữu ích để mô hình hóa dữ liệu đếm, giúp so sánh tỷ suất sự kiện giữa các nhóm và đánh giá yếu tố nguy cơ trong nghiên cứu y tế công cộng.
+
+
+