So sánh 2 dãy số trong thống kê

1. Giới thiệu

Trong phần trước chúng ta đã nghiên cứu phương pháp suy luận thống kê về trung bình của một biến số định lượng trong một dân số, dựa trên số liệu từ một mẫu ngẫu nhiên hoặc trung bình của hiệu số trước sau của một biến số của cùng dân số.  Trên thực tế, chúng ta thường phải thực hiện việc so sánh trung bình của hai dân số sử dụng mẫu không bắt cặp. Ðó là hai mẫu chúng ta chọn từ hai dân số khác nhau và không có sự liên hệ gì giữa các quan sát, chẳng hạn quan sát thứ nhất của mẫu một không có liên hệ gì với quan sát thứ nhất của mẫu hai.

Trong phần này chúng ta sẽ nghiên cứu hai phương pháp

1. Tính khoảng tin cậy của hiệu số hai trung bình và

2. Kiểm định giả thuyết hai trung bình là bằng nhau

ứng dụng cho hai mẫu không bắt cặp.

2. Kí hiệu

Chúng ta kí hiệu trung bình và độ lệch chuẩn của biến số x trong dân số thứ nhất  là m1s1 và trong dân số thứ hai là m2s2.  Hiển nhiên là với hai dân số xác định,  các trung bình m1, m2 và các độ lệch chuẩn dân số s1  và s2  là không đổi.

Nếu chúng ta nghiên cứu n1 đối tượng được chọn ngẫu nhiên trong dân số 1 và n2 đối tượng được chọn ngẫu nhiên trong dân số 2, chúng ta sẽ tính được trung bình `x1 và độ lệch chuẩn s1 của mẫu 1 và trung bình `x2 và độ lệch chuẩn s2 của mẫu 2.

Dân số 1

Mẫu 1

Dân số 2

Mẫu 2

Trung bình

m1

`x1

m2

`x2

Ðộ lệch chuẩn

s1

s1

s2

s2

3. Thí dụ

Ðể đánh giá sự liên hệ giữa tình trạng dinh dưỡng ở tuổi thiếu nhi và khả năng hoạt động thể lực ở tuổi trưởng thành, một nghiên cứu được tiến hành ở 2 làng_. Ở một làng, tất cả các bà mẹ mang thai hay cho con bú và tất cả trẻ em dưới 7 tuổi được bổ sung  thực phẩm giàu năng lượng và giàu protein (Atole: 163 KCal + 6,4 g protein/180 mL) và ở làng khác các bà mẹ và trẻ em chỉ được bổ sung thực phẩm nghèo năng lượng và không có protein  (Fresco: 59 KCal + 0 g protein/180 mL).  Can thiệp dinh dưỡng được chấm dứt vào năm 1977. Vào năm 1988, các nhà nghiên cứu trở lại làng và tiến hành đo đạc  tốc độ tiêu thụ oxy cực đại (VO2max) trên các nam thanh niên từ 14 đến 18 tuổi (đây là các đối tượng được bổ sung dinh dưỡng trong lúc mang thai và ít nhất trong 3 năm đầu cuộc đời). Kết quả như sau

Nhóm can thiệp

n

VO2max (L/phút)

Trung bình mẫu

Ðộ lệch chuẩn

Atole

44

2,62

0,54

Fresco

42

2,24

0,54

Từ số liệu này chúng ta có thể kết luận gì về tốc độ tiêu thụ oxy cực đại ở hai nhóm can thiệp dinh dưỡng.

4. Phân phối mẫu của hiệu số hai trung bình

Giả sử chúng ta có một dân số P1 gồm nhiều đối tượng được bổ sung dinh dưỡng với Atole và một dân số P2 gồm nhiều đối tượng được bổ sung dinh dưỡng với Fresco. Giả sử chúng ta tiến hành nhiều lần việc rút ra cỡ mẫu gồm 44 nam thanh niên từ dân số P1 và 42 nam thanh niên từ dân số P2 và chúng ta tính hiệu số trung bình (`x1 -`x2). Phân phối của các hiệu số trung bình (`x1 -`x2) có các đặc tính sau thay đổi tuỳ theo giả định của chúng ta:

a. Phương sai của 2 dân số bằng nhau

1. Giá trị `x1 -`x2 sẽ thay đổi  từ mẫu này sang mẫu khác (`x1, s1,`x2, s2 cũng thay đổi từ mẫu này sang mẫu khác)

2. Giá trị `x1 -`x2 sẽ phân phối đối xứng chung quanh giá trị (m1 - m2) là hiệu số trung bình thực của dân số P1 và P2:

3. Các giá trị gần (m1 - m2) sẽ phổ biến hơn các giá trị xa với (m1 - m2)

4. Sai số chuẩn của (`x1 -`x2) sẽ được tính theo công thức:

So sánh 2 dãy số trong thống kê

Viết theo ngôn ngữ toán học hình thức

X1~N(m1,s2)  và X2~N(m2,s2) => (`X1 -`X2)~(m1 -m2   , )

b. Phương sai của 2 dân số khác nhau

1. Giá trị `x1 -`x2 sẽ thay đổi  từ mẫu này sang mẫu khác (`x1, s1,`x2, s2 cũng thay đổi từ mẫu này sang mẫu khác)

2. Giá trị `x1 -`x2 sẽ phân phối đối xứng chung quanh giá trị (m1 - m2) là hiệu số trung bình thực của dân số P1 và P2:

3. Các giá trị gần (m1 - m2) sẽ phổ biến hơn các giá trị xa với (m1 - m2)

4. Sai số chuẩn của (`x1 -`x2) sẽ được tính theo công thức:

Viết theo ngôn ngữ toán học hình thức

X1~N(m1,s12)  và X2~N(m2,s22) => (`X1 -`X2)~(m1 -m2   , )

Công thức này có thể chứng minh sử dụng định lí: phương sai của tổng (hay hiệu) của 2 biến số độc lập sẽ bằng tổng của hai phương sai của 2 biến số đó.

            Phương sai của (`x1 -`x2)       = Phương sai của (`x1 ) + Phương sai của (`x2)

                                                            =

6. Kiểm định giả thuyết để so sánh hai trung bình

Chúng ta có thể muốn kiểm định giả thuyết là hai trung bình dân số, m1 và  m2, bằng nhau hay nói khác đi (m1 - m2)=0. Nếu giả thuyết Ho đúng thì hiệu số trung bình mẫu sẽ có phân phối bình thường, tập trung tại giá trị 0 và có sai số chuẩn thay đổi tuỳ theo giả định

a. Phương sai của 2 dân số bằng nhau

Khi đó, Giá trị Z của hiệu số trung bình mẫu sẽ :      

Tuy nhiên trên thực tiễn do chúng ta không thể xác định s một cách chính xác, chúng ta phải sử dụng  để thay thế cho s. Khi đó chúng ta sẽ có giá trị t

  với n1+n2-2  độ tự do                          (1)

b . Phương sai của 2 dân số khác nhau

Khi đó, Giá trị Z của hiệu số trung bình mẫu sẽ :      

Cũng tương tự như lập luận ở trên, trên thực tiễn do chúng ta không biết được chính xác s1s2, nên chúng ta phải sử dụng s1 thay thế cho s1 và s2 thay thế cho s2 và chúng ta có giá trị t:

                                                   (2)

với                                      (3)

Việc công thức tính độ tự do khi sử dụng giả định 2 phương sai khác nhau tương đối khó nhớ nên độ tự do của phân phối t khi phương sai không bằng nhau thường chỉ tính toán các phần mềm thống. Khi phân tích thống kê với máy tính cầm tay, người ta thường giả định nếu cỡ mẫu của 2 nhóm đều trên 20 thì độ tự do của t sẽ trên 30 (xem bảng 1). Khi đó có thể không cần tra bảng t mà chỉ cần tra bảng phân phối chuẩn. Do đó, đôi  khi công thức kiểm định t cho 2 trung bình khi phương sai không bằng nhau với cỡ mẫu lớn còn được gọi là công thức kiểm định z

Bảng 3. Độ tự do của t khi phương sai không bằng nhau tương ứng với  phương sai nhóm và cỡ mẫu của 2 nhóm khác nhau

Độ lệch chuẩn nhóm 1: s1

1

1

1

2

2

2

Cỡ mẫu nhóm 1: n1

10

20

20

10

20

20

Độ lệch chuẩn nhóm 2: s2

1

1

1

1

1

1

Cỡ mẫu nhóm 2: n2

10

10

20

10

10

20

Độ tự do

18

18

38

13

28

28

Tóm lại, chúng ta có 2 công thức để kiểm định 2 trung bình:  công thức (1) và công thức (2). Cả hai công thức này đều chỉ sử dụng được khi biến số cần so sánh có phân phối bình thường. Tuy nhiên công thức (1) sử dụng khi có thể giả định là 2 phương sai bằng nhau và công thức (2) chỉ đơn giản để sử dụng khi cỡ mẫu của 2 nhóm đều lớn. Trong trường hợp nếu 2 phương sai không bằng nhau, chúng ta sử dụng công thức (2) và tính toán cụ thể độ tự do theo công thức (3).

7. Thí dụ về tính toán kiểm định so sánh 2 trung bình

1. Trong thí dụ so sánh tốc độ sử dụng oxy cực đại ở hai nhóm thanh niên,  giả thuyết Ho được đưa ra là

Ho: trung bình tốc độ sử dụng oxy cực đại ở nhóm Atole bằng trung bình tốc độ sử dụng oxy cực đại ở nhóm Fresco

            mA = mF

Bởi vì cả hai giả định (a) phương sai bằng nhau và (b) cỡ mẫu 2 nhóm đều lớn đều đúng, chúng ta có thể chọn sử dụng một trong 2 phương pháp kiểm định ở trên:

2a. Kiểm định sử dụng giả định phương sai bằng nhau

3a. Tính giá trị thống kê


với 84 độ tự do

4a. Vì độ tự do khá lớn nên chúng ta có thể tra bảng phân phối chuẩn z thay cho bảng t. Ta có

P(|Z|³3,26)=0,0012

Nếu chúng ta không thể tính trực tiếp p, tra bảng chúng ta có thể biết rằng p <0,01 và p>0,001

5a. Khi đó chúng ta có thể bác bỏ Ho với p=0,0011, hay nói khác đi số liệu cho phép kết luận can thiệp dinh dưỡng bằng Atole ở tuổi nhà trẻ làm tăng tốc độ sử dụng oxy tối đa ở tuổi trưởng thành (p=0,0011).

2b. Kiểm định sử dụng giả định phương sai không bằng nhau

3b. Tính giá trị thống kê

bởi vì cỡ mẫu của 2 nhóm đều lớn chúng ta có thể cho rằng độ tự do của t cũng khá lớn và có thể tra bảng phân phối chuẩn z thay cho bảng t. Nếu muốn chặt chẽ chúng ta có thể sử dụng cong thức đã trình bày ở trên để tính độ tự do của phân phối t bằng 83,8.

4b. Tính giá trị p:

P(|Z|³3,26)=0,0012

5b. Kết luận:

Chúng ta có thể bác bỏ Ho với p=0,0011, hay nói khác đi số liệu cho phép kết luận can thiệp dinh dưỡng bằng Atole ở tuổi nhà trẻ làm tăng tốc độ sử dụng oxy tối đa ở tuổi trưởng thành (p=0,0012).

7. Ðiều kiện sử dụng test Z

Test Z như trình bày ở trên đòi hỏi 2 giả định:

1. Phân phối mẫu của trung bình mẫu và phân phối mẫu của hiệu số trung bình mẫu có phân phối xấp xỉ bình thường.

2. Ðộ lệch chuẩn thực sự (độ lệch chuẩn dân số) s1s2 có thể được ước lượng một cách chính xác bằng độ lệch chuẩn mẫu s1 và s2.

Chính xác ra, giả định thứ nhất chỉ đúng nếu giá trị của số liệu trong dân số có phân phối bình thường. Tuy nhiên theo định lí giới hạn trung tâm, với cỡ mẫu lớn thì phân phối của trung bình mẫu sẽ tiệm cận phân phối bình thường ngay cả khi giá trị của số liệu trong dân số không có phân phối bình thường.

Về giả định thứ hai, s1 và s2. cũng ước lượng khá chính xác s1s2  nếu cỡ mẫu lớn. Vì vậy, phương pháp z nói chung đáng tin cậy khi cỡ mẫu đủ lớn (cỡ mẫu của mỗi nhóm từ 20 trở lên) và hình dạng của tổ chức đồ không quá không bình thường. Ngoài ra nếu phân tích trên tổ chức đồ chúng ta thấy phân phối bị lệch dương, chúng ta cần phải dùng biến đổi log để phân phối trở lại gần giống phân phối bình thường.

8. Phương pháp với mẫu nhỏ

Nếu một trong haimẫu nhỏ, cả hai giả định nêu ở trên sẽ bị vi phạm và khi đó sử dụng xấp xỉ bình thường là không đáng tin cậy.

Tuy nhiên nếu chúng ta phân tích tổ chức đồ cho thấy các giá trị là tương đối đối xứng và không quá khác biệt với phân phối bình thường, chúng ta có thể sử dụng phương pháp biến cải từ phép kiểm định z nêu ở trên. Ðó là sử dụng phân phối t và trong đó chấp nhận sai số  thêm vào khi sử dụng độ lệch chuẩn mẫu s1 và s2 thay vì độ lệch chuẩn thực s1s2. Tuy nhiên phương pháp này đòi hỏi thêm một giả định là hai độ lệch chuẩn thực s1s2 là bằng nhau và bằng với giá trị chung s. Vì vậy phương pháp này đòi hỏi hai độ lệch chuẩn không quá khác nhau (tỉ số của chúng không lớn hơn 2).

Công thức của kiểm định t cũng tương tự như kiểm định z nhưng chỉ khác ở công thức của sai số chuẩn:

Trong công thức trên s là ước lượng của độ lệch chuẩn chung s và được gọi là độ lệch chuẩn gộp (pooled standard deviation) và trung bình của hai độ lệch chuẩn s1 và s2 với hệ số là mẫu số trong công thức tính độ lệch chuẩn.

Ðể kiểm định ý nghĩa thống kê người ta tính giá trị t

 

rồi tính P(|t|>to) bằng cách sử dụng các phần mềm máy tính hay tra bảng phân phối student với (n1+n2-2) độ tự do. Trong trường hợp này người ta gọi  đây là test t không bắt cặp.

Ðể tính khoảng tin cậy của hiệu số (m1 - m2) bằng thống kê t ta sử dụng công thức:

giá trị t ở đây cũng được tra từ bảng phân phối student.

9. So sánh kiểm định z và kiểm định t

Kiểm định z và kiểm định t hoàn toàn tương đương trong thống kê các biến số định lượng. Như vậy chúng ta có thể sử dụng thống kê z hay t trong ước lượng khoảng tin cậy của trung bình, của hiệu số 2 trung bình, kiểm định ý nghĩa trong so sánh 2 trung bình ở thiết kế có bắt cặp và không bắt cặp. Chúng chỉ khác nhau về điều kiện áp dụng. Ðiều kiện áp dụng của thống kê z là cỡ mẫu đủ lớn  (để trung bình mẫu có phân phối bình thường và độ lệch chuẩn mẫu gần bằng độ lệch chuẩn dân số). Ðiều kiện áp dụng thống kê t là phân phối của các giá trị phải xấp xỉ bình thường (trong trường hợp so sánh 2 mẫu nó cần thêm điều kiện là hai độ lệch chuẩn của 2 mẫu không quá khác nhau).

Khi chúng ta không thể áp dụng thống kê z hay thống kê t, thí dụ như  khi  cỡ mẫu nhỏ và phân phối không bình thường hoặc hai phương sai không đồng nhất ta cần phải sử dụng các phép kiểm phi tham số.

5. Khoảng tin cậy của hiệu số hai trung bình

Sử dụng lập luận chúng ta đã trình bày cho việc tính các khoảng tin cậy  của trung bình và tỉ lệ đơn, chúng ta sẽ có các công thức khoảng tin cậy 95% của hiệu số (m1 - m2) tuỳ theo các giả định:

a. Giả định phương sai 2 nhóm bằng nhau

 Ðể tính khoảng tin cậy của hiệu số (m1 - m2) bằng thống kê t ta sử dụng công thức:

 với tc là giá trị tới hạn của phân phối t ở n1+n2- 2 độ tự do

với

b. Giả định phương sai 2 nhóm không bằng nhau

Khoảng tin cậy của hiệu số (m1 - m2) khi phương sai của 2 nhóm không bằng nhau được tính theo công thức:

 với tc là giá trị tới hạn của phân phối t với độ tự do

Khi cỡ mẫu đủ lớn chúng ta không cần phải tính độ tự do (bởi vì độ tự do cũng khá lớn) mà chỉ cần áp dụng giá trị tới hạn của z thay cho giá trị tới hạn của t.

Áp dụng trong nghiên cứu về can thiệp dinh dưỡng lên khả năng hoạt động thể lực, khoảng tin cậy 95% của VO2max là:

Khoảng tin cậy 95% trên có ý nghĩa: Xác suất hiệu số của trung bình tốc độ oxy tối đa các nam thanh niên can thiệp dinh dưỡng bằng Atole và nhóm can thiệp bằng Fresco nằm trong khoảng 0,38 đến 0,61 lít/phút là 95%.