Ví dụ: chọn mẫu ngẫu nhiên đơn giản

Một mẫu ngẫu nhiên đơn giản được định nghĩa là mẫu mà trong đó mỗi phần tử của tập tổng thể có một xác suất được chọn bằng nhau và độc lập với nhau. Trong trường hợp một tập với N phần tử, xác suất lựa chọn n phần tử mẫu, với tất cả các khả năng kết hợp của NCn mẫu sẽ là 1/NCn. Nghĩa là nếu chúng ta có một tập gồm 5 phần tử (A, B, C, D, E), nghĩa là N là 5, và chúng ta muốn một mẫu có n = 3, vậy sẽ có 5C3 = 10 mẫu có thể và xác suất một phần tử bất kỳ thuộc tập mẫu sẽ là 1/10.

Lấy mẫu ngẫu nhiên đơn giản có thể thực hiện theo hai cách khác nhau bao gồm ‘có thay thế’ hoặc ‘không thay thế’. Khi các phần tử được lựa chọn vào một mẫu lần lượt bằng cách thay thế các phần tử đã được chọn trước đó, trước khi lần chọn mới bắt đầu, nó được gọi là lấy mẫu ngẫu nhiên có thay thế. Nếu các đối tượng được lựa chọn không được thay thế, trước khi lần chọn mới bắt đầu, thì nó được gọi là lấy mẫu ngẫu nhiên đơn giản không thay thế. Vậy trong phương pháp đầu tiên, một phần tử khi đã được lựa chọn có thể được lặp lại, trong khi đó với phương pháp thứ hai thì khi đã lựa chọn, một phần tử không được phép lặp lại. Do tính hiệu quả khi kết hợp với thống kê, phương pháp lựa chọn ngẫu nhiên đơn giản không thay thế thường được áp dụng hơn.

Một mẫu ngẫu nhiên đơn giản có thể có được thông qua hai quá trình, nghĩa là phương pháp xổ số và bảng số ngẫu nhiên.

  • Phương pháp xổ số - Với phương pháp này, các phần tử được lựa chọn dựa trên yếu tố rút thăm ngẫu nhiên. Đầu tiên mỗi phần tử hoặc đối tượng của tập tổng thể được gán một số duy nhất. Bước tiếp theo, các số này được ghi vào các thẻ riêng biệt với hình dạng, kích thước, màu sắc…là như nhau. Sau đó chúng được đặt vào một chiếc rổ và được xáo trộn. Trong bước cuối cùng, các thẻ được rút ra ngẫu nhiên mà không được xem nội dung bên trong. Số lượng thẻ rút ra ứng với kích thước mẫu cần thiết.

Phương pháp xổ số có một vài nhược điểm. Quá trình ghi N số vào thẻ thường vất vả và xáo trộn số lượng thẻ với kích thước tập tổng thể lớn là vô cùng khó khăn. Hơn nữa, sai số con người có thể ảnh hưởng tới việc lựa chọn thẻ. Vì vậy, phương pháp số ngẫu nhiên có thể được sử dụng để thay thế.

  • Phương pháp bảng số ngẫu nhiên – Nó gồm các cột số được chuẩn bị ngẫu nhiên. Có nhiều bảng ngẫu nhiên có sẵn ví dụ như bảng Fisher và Yates, số ngẫu nhiên Tippets…Liệt kê dưới đây là một chuỗi gồm các số ngẫu nhiên hai chữ số từ bảng Fisher và Yates:

61, 44, 65, 22, 01, 67, 76, 23, 57, 58, 54, 11, 33, 86, 07, 26, 75, 76, 64, 22, 19, 35, 74, 49, 86, 58, 69, 52, 27, 34, 91, 25, 34, 67, 76, 73, 27, 16, 53, 18, 19, 69, 32, 52, 38, 72, 38, 64, 81, 79 và 38.

Bước đầu tiên liên quan tới việc gán một số duy nhất cho mỗi đối tượng của tập tổng thể nghĩa là nếu một tập tổng thể gồm 20 người vậy từng cá nhân sẽ được đánh số từ 01 tới 20. Nếu chúng ta thu thập một mẫu gồm 5 phần tử vậy nghĩa là bảng số ngẫu nhiên với 5 số có 2 chữ số sẽ được chọn. Ví dụ: sử dụng bảng trên trong trường hợp các phần tử có 5 số sau sẽ tạo thành một mẫu: 01, 11, 07, 19 và 16. Nếu mẫu là không thay thế và một số ngẫu nhiên tự lặp lại chính nó thì nó sẽ không được chọn lại và số tiếp theo thỏa mãn điều kiện của chúng ta sẽ được chọn.

Vậy một mẫu ngẫu nhiên đơn giản có thể có được bằng cách dùng một trong hai phương pháp trên. Tuy nhiên trong thực tế, người ta nhận thấy rằng mẫu ngẫu nhiên đơn giản thường tốn khá nhiều thời gian và công sức để sinh ra, và nó không thực tế.

Tổng thể là tập hợp tất cả các đối tượng khảo sát. Có nơi còn gọi là đám đông. Đám đông, tổng thể hay population là như nhau.

Các đơn vị (hay phần tử) tạo thành tổng thể được gọi là đơn vị tổng thể. Số  lượng  phần  tử trong đám đông thường được ký hiệu là N (được gọi là kích thước đám đông).

Ví dụ: Người ta muốn kiểm tra tuổi thọ của những bóng đèn mà công ty A  (tuổi thọ trung bình của bóng đèn mới chưa biết),  thì tổng thể chính là toàn bộ số bóng đèn mới mà công ty sản xuất ra.

Mẫu

Mẫu (sample) là tập hợp nhỏ những phần tử lấy ra từ một tổng thể lớn, người ta sẽ nghiên cứu những mẫu đó để tìm ra các đặc trưng của mẫu. Các đặc trưng mẫu được sử dụng để suy rộng ra các đặc trưng chung của tổng thể do nó làm đại diện.

Số lượng phần tử của mẫu thường được ký hiệu là n (được gọi là cỡ, hay kích thước mẫu).

Ví dụ: Người ta chọn ta 200 bóng đèn mà công ty A sản xuất làm mẫu để kiểm tra tuổi thọ của chúng.

Chọn mẫu (Sampling):

Là việc lấy một số phần tử của một tổng thể (population) để nghiên cứu và từ đó, có thể rút ra các kết luận về chính tổng thể đó. Điều này có nghĩa là khi nghiên cứu một tổng thể nghiên cứu nào đó, ta không nghiên cứu toàn bộ tổng thể mà chỉ một bộ phận của tổng thể, và cách thức mà ta chọn ra bộ phận đó, chính là chọn mẫu.

Tại sao phải chọn mẫu?

Khi thực hiện nghiên cứu,chúng ta rất hiếm khi điều tra tổng thể, vì lý do cơ bản là hết sức tốn kém và tốn rất nhiều thời gian, công sức.

Khi điều tra chọn mẫu sẽ có nhiều lợi thế:

  • Chọn mẫu cho phép tiết kiệm được thời gian và chi phí, nhân lực nếu so sánh với việc khảo sát hay điều tra toàn bộ đối tượng.
  • Chọn mẫu đúng cách vẫn cho phép đạt được mức chính xác cần có của kết quả
  • Chọn mẫu cho phép ta đạt tốc độ thu thập dữ liệu cao hơn, nhanh gọn và đảm bảo tính kịp thời của số liệu thống kê.
  • Tính sẳn có của các phần tử tổng thể cũng là lợi thế của chọn mẫu.
  • Cho phép thu thập được nhiều chỉ tiêu thống kê, đặc biệt đối với các chỉ tiêu có nội dung phức tạp, không có điều kiện điều kiện điều tra ở diện rộng.
  • Việc kiểm tra hay khảo sát đôi khi làm hủy hoại hay thay đổi mẫu khảo sát, dó đó không thể thử nghiệm hết toàn bộ mà chỉ thử nghiệm một số lượng mẫu nhỏ mà thôi.
  • Chọn mẫu trong nghiên cứu làm giảm sai số phi chọn mẫu (sai số do cân, đo, đếm, khai báo, ghi chép,…).

Hạn chế của việc chọn mẫu trong nghiên cứu khoa học: tồn tại “Sai số chọn mẫu”.

CÁC PHƯƠNG PHÁP CHỌN MẪU VÀ QUY TRÌNH CHỌN MẪU:

Các phương pháp chọn mẫu

Có 2 cách lấy mẫu: Chọn mẫu theo xác suất và Chọn mẫu phi xác suất

  • Chọn mẫu theo xác suất là phương pháp chọn mẫu mà khả năng được chọn vào tổng thể của tất cả các đơn vị của tổng thể đều như nhau.
  • Chọn mẫu phi xác suất là phương pháp chọn mẫu mà các đơn vị trong tổng thể chung không có khả năng ngang nhau để được chọn vào mẫu nghiên cứu.

Các phương pháp chọn mẫu theo xác suất:

1. Phương pháp chọn ngẫu nhiên đơn giản (Simple random sampling):

  • Lập danh sách các phần tử và đánh số thứ tự
  • Chọn ngẫu nhiên các phần tử từ danh sách. Để đảm bảo tính ngẫu nhiên, có thể quay số, hoặc chọn ngẫu nhiên bằng phần mềm máy tính.

–  Ví dụ: kiểm tra chất lượng sản phẩm trong dây chuyền sản xuất hàng loạt.

Ưu điểm: Cách làm đơn giản, tính đại diện cao; Có thể lồng vào các kỹ thuật chọn mẫu khác.

Nhược điểm: Cần phải có khung mẫu; Các cá thể được chọn vào mẫu có thể phân bố tản mạn trong quần thể, do vậy việc thu thập số liệu tốn kém và mất thời gian.

2. Phương pháp chọn mẫu hệ thống (Systematic sampling):

  • Lập danh sách các phần tử và đánh số thứ tự
  • Chọn từ danh sách các phần tử có vị trí cách đều nhau sao cho đủ cỡ mẫu quy định.

3. Phương pháp chọn mẫu ngẫu nhiên có phân tổ hay phân tầng

  • Chia tổng thể thành các tổ theo một tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu.
  • Trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu.
  • Tỷ lệ mẫu lấy trong từng tổ bằng với tỷ lệ của tổ đó trong tổng thể.

Đối với chọn mẫu phân tầng: Phổ biến nhất vì tính chính xác và đại diện cao, ít tốn kém.

4. Phương pháp chọn mẫu ngẫu nhiên tích tụ (hoặc tập trung)

  • Lập danh sách tổng thể chung theo từng khối (cluster).
  • Chọn ngẫu nhiên một số khối, điều tra các khối đó.
  • Áp dụng phương pháp này khi không có sẵn danh sách đầy đủ các đơn vị trong tổng thể cần nghiên cứu.

Ví dụ: Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách sinh viên, tiếp theo chọn ra các lớp điều tra.

  • Ưu điểm: Không cần lập danh sách tổng thể, tiết kiệm 1 phần chi phí.
  • Nhược điểm: Không xác định số phần tử mẫu cần lấy là bao nhiêu, tính đại diện mẫu chưa cao.

5. Chọn mẫu nhiều giai đoạn

Trước tiên phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II…

Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra các đơn vị mẫu.

–   Ưu điểm: Có thể áp dụng trong điều tra phạm vi rộng, phân tán, không có được danh sách các đơn vị nghiên cứu; Khung mẫu đơn giản, dễ lập; Điều tra dễ, nhanh vì đối tượng nghiên cứu được nhóm lại; Nâng cao chất lượng giám sát và đảm bảo chất lượng số liệu; Tiết kiệm kinh phí, thời gian.

–   Nhược điểm: Tính chính xác và đại diện thấp; Cần số chùm/cụm lớn.

Phương pháp chọn mẫu phi xác suất:

1. Phương pháp chọn mẫu thuận tiện

Chọn mẫu dựa trên sự thuận tiện trong lấy mẫu.

  • Ưu điểm: Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông tin.
  • Nhược điểm: Không xác định được sai số lấy mẫu và không thể kết luận cho tổng thể từ kết quả mẫu, sử dụng phổ biến khi giới hạn về thời gian và chi phí.

2. Phương pháp chọn mẫu theo phán đoán

Đây là cách lấy mẫu tùy theo chủ quan phán đoán của nhà nghiên cứu. Chỉ áp dụng khi các đặc tính cùa phần tử được chọn đã khá rõ ràng.

  • Ưu/ nhược điểm:  giống chọn mẫu thuận tiện, nhưng nếu có khả năng hoặc kinh nghiệm phán đoán tốt sẽ cho mẫu tốt hơn thuận tiện.

3. Phương pháp chọn mẫu theo định mức

Đây là cách giao chỉ tiêu phải phỏng vấn bao nhiêu người trong thời gian qui định.

  • Tiến hành phân tổ tổng thể theo một tiêu thức nào đó mà ta đang quan tâm.
  • Sau đó dùng phương pháp chọn mẫu thuận tiên hay chọn mẫu phán đoán để chọn các đơn vị trong từng tổ để tiến hành điều tra.

Ví dụ: Nhà nghiên cứu yêu cầu các vấn viên đi phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố. Ta có chọn dựa theo 2 tiêu thức phân tổ như sau:

  • Chọn 400 người (200 nam và 200 nữ) có tuổi từ 18 đến 40
  • Chọn 400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên.

Sau đó nhân viên điều tra có thể chọn những người gần nhà hay thuận lợi cho việc điều tra của họ để dễ nhanh chóng hoàn thành công việc.

Ở trên là phân bổ theo tiêu thức: độ tuổi và giới tính. Ta có thể sử dụng nhiều tiêu thức hơn.

4. Phương pháp chọn mẫu tích lũy nhanh

Bắt đầu từ một phần tử được chọn lọc nào đó. Sau đó nhờ người này giới thiệu hoặc định danh những người khác cùng đặc tính như họ để phỏng vấn tiếp.

Áp dụng cho các nghiên cứu khá đặc biệt, mẫu khó tìm hoặc khó tiếp cận.

Các phương pháp chọn mẫu

Chọn mẫu xác suấtChọn mẫu phi xác suất
Ngẫu nhiên đơn giảnChọn mẫu thuật tiện
Chọn mẫu hệ thốngChọn mẫu theo phán đoán
Chọn mẫu phân tầngChọn mẫu tích lũy nhanh
Chọn mẫu tập trung (hoặc theo cụm)Chọn mẫu theo định mức

Ở các cách trên, trong chọn mẫu phân tầng, phần tử giữa các tầng có sự khác biệt, trong cùng tầng đồng nhất; trong chọn mẫu theo cụm, phần tử trọng một cụm đa dạng, giữa các cụm ít có sự khác biệt.

Trong chọn mẫu theo định mức, nếu nhà nghiên cứu chọn được tiêu chức phân nhóm phù hợp và chọn định mức cho mỗi nhóm phù hợp thì sẽ giống như chọn mẫu phân tầng.

Qui trình chọn mẫu

Chọn mẫu là quá trình chọn lựa một bộ phận tương đối nhỏ từ một tổng thể mang tính đại diện cho tổng thể nghiên cứu bao gồm 5 bước:

  • Bước 1: Xác định tổng thể nghiên cứu
  • Bước 2: Xác định khung chọn mẫu
  • Bước 3: Lựa chọn phương pháp lấy mẫu: Xác xuất hoặc phi xác suất
  • Bước 4: Quyết định quy mô của mẫu
  • Bước 5: Viết hướng dẫn cho việc xác định và lựa chọn các phần tử trong thực tế của mẫu.