Ví dụ: chọn mẫu ngẫu nhiên đơn giản
Một mẫu ngẫu nhiên đơn giản được định nghĩa là mẫu mà trong đó mỗi phần tử của tập tổng thể có một xác suất được chọn bằng nhau và độc lập với nhau. Trong trường hợp một tập với N phần tử, xác suất lựa chọn n phần tử mẫu, với tất cả các khả năng kết hợp của NCn mẫu sẽ là 1/NCn. Nghĩa là nếu chúng ta có một tập gồm 5 phần tử (A, B, C, D, E), nghĩa là N là 5, và chúng ta muốn một mẫu có n = 3, vậy sẽ có 5C3 = 10 mẫu có thể và xác suất một phần tử bất kỳ thuộc tập mẫu sẽ là 1/10. Show Lấy mẫu ngẫu nhiên đơn giản có thể thực hiện theo hai cách khác nhau bao gồm ‘có thay thế’ hoặc ‘không thay thế’. Khi các phần tử được lựa chọn vào một mẫu lần lượt bằng cách thay thế các phần tử đã được chọn trước đó, trước khi lần chọn mới bắt đầu, nó được gọi là lấy mẫu ngẫu nhiên có thay thế. Nếu các đối tượng được lựa chọn không được thay thế, trước khi lần chọn mới bắt đầu, thì nó được gọi là lấy mẫu ngẫu nhiên đơn giản không thay thế. Vậy trong phương pháp đầu tiên, một phần tử khi đã được lựa chọn có thể được lặp lại, trong khi đó với phương pháp thứ hai thì khi đã lựa chọn, một phần tử không được phép lặp lại. Do tính hiệu quả khi kết hợp với thống kê, phương pháp lựa chọn ngẫu nhiên đơn giản không thay thế thường được áp dụng hơn. Một mẫu ngẫu nhiên đơn giản có thể có được thông qua hai quá trình, nghĩa là phương pháp xổ số và bảng số ngẫu nhiên.
Phương pháp xổ số có một vài nhược điểm. Quá trình ghi N số vào thẻ thường vất vả và xáo trộn số lượng thẻ với kích thước tập tổng thể lớn là vô cùng khó khăn. Hơn nữa, sai số con người có thể ảnh hưởng tới việc lựa chọn thẻ. Vì vậy, phương pháp số ngẫu nhiên có thể được sử dụng để thay thế.
61, 44, 65, 22, 01, 67, 76, 23, 57, 58, 54, 11, 33, 86, 07, 26, 75, 76, 64, 22, 19, 35, 74, 49, 86, 58, 69, 52, 27, 34, 91, 25, 34, 67, 76, 73, 27, 16, 53, 18, 19, 69, 32, 52, 38, 72, 38, 64, 81, 79 và 38. Bước đầu tiên liên quan tới việc gán một số duy nhất cho mỗi đối tượng của tập tổng thể nghĩa là nếu một tập tổng thể gồm 20 người vậy từng cá nhân sẽ được đánh số từ 01 tới 20. Nếu chúng ta thu thập một mẫu gồm 5 phần tử vậy nghĩa là bảng số ngẫu nhiên với 5 số có 2 chữ số sẽ được chọn. Ví dụ: sử dụng bảng trên trong trường hợp các phần tử có 5 số sau sẽ tạo thành một mẫu: 01, 11, 07, 19 và 16. Nếu mẫu là không thay thế và một số ngẫu nhiên tự lặp lại chính nó thì nó sẽ không được chọn lại và số tiếp theo thỏa mãn điều kiện của chúng ta sẽ được chọn. Vậy một mẫu ngẫu nhiên đơn giản có thể có được bằng cách dùng một trong hai phương pháp trên. Tuy nhiên trong thực tế, người ta nhận thấy rằng mẫu ngẫu nhiên đơn giản thường tốn khá nhiều thời gian và công sức để sinh ra, và nó không thực tế.
Tổng thể là tập hợp tất cả các đối tượng khảo sát. Có nơi còn gọi là đám đông. Đám đông, tổng thể hay population là như nhau. Các đơn vị (hay phần tử) tạo thành tổng thể được gọi là đơn vị tổng thể. Số lượng phần tử trong đám đông thường được ký hiệu là N (được gọi là kích thước đám đông). Ví dụ: Người ta muốn kiểm tra tuổi thọ của những bóng đèn mà công ty A (tuổi thọ trung bình của bóng đèn mới chưa biết), thì tổng thể chính là toàn bộ số bóng đèn mới mà công ty sản xuất ra. MẫuMẫu (sample) là tập hợp nhỏ những phần tử lấy ra từ một tổng thể lớn, người ta sẽ nghiên cứu những mẫu đó để tìm ra các đặc trưng của mẫu. Các đặc trưng mẫu được sử dụng để suy rộng ra các đặc trưng chung của tổng thể do nó làm đại diện. Số lượng phần tử của mẫu thường được ký hiệu là n (được gọi là cỡ, hay kích thước mẫu). Ví dụ: Người ta chọn ta 200 bóng đèn mà công ty A sản xuất làm mẫu để kiểm tra tuổi thọ của chúng. Chọn mẫu (Sampling):Là việc lấy một số phần tử của một tổng thể (population) để nghiên cứu và từ đó, có thể rút ra các kết luận về chính tổng thể đó. Điều này có nghĩa là khi nghiên cứu một tổng thể nghiên cứu nào đó, ta không nghiên cứu toàn bộ tổng thể mà chỉ một bộ phận của tổng thể, và cách thức mà ta chọn ra bộ phận đó, chính là chọn mẫu. Tại sao phải chọn mẫu?Khi thực hiện nghiên cứu,chúng ta rất hiếm khi điều tra tổng thể, vì lý do cơ bản là hết sức tốn kém và tốn rất nhiều thời gian, công sức. Khi điều tra chọn mẫu sẽ có nhiều lợi thế:
Hạn chế của việc chọn mẫu trong nghiên cứu khoa học: tồn tại “Sai số chọn mẫu”. CÁC PHƯƠNG PHÁP CHỌN MẪU VÀ QUY TRÌNH CHỌN MẪU:Các phương pháp chọn mẫuCó 2 cách lấy mẫu: Chọn mẫu theo xác suất và Chọn mẫu phi xác suất
Các phương pháp chọn mẫu theo xác suất:1. Phương pháp chọn ngẫu nhiên đơn giản (Simple random sampling):
– Ví dụ: kiểm tra chất lượng sản phẩm trong dây chuyền sản xuất hàng loạt. Ưu điểm: Cách làm đơn giản, tính đại diện cao; Có thể lồng vào các kỹ thuật chọn mẫu khác. Nhược điểm: Cần phải có khung mẫu; Các cá thể được chọn vào mẫu có thể phân bố tản mạn trong quần thể, do vậy việc thu thập số liệu tốn kém và mất thời gian. 2. Phương pháp chọn mẫu hệ thống (Systematic sampling):
3. Phương pháp chọn mẫu ngẫu nhiên có phân tổ hay phân tầng
Đối với chọn mẫu phân tầng: Phổ biến nhất vì tính chính xác và đại diện cao, ít tốn kém. 4. Phương pháp chọn mẫu ngẫu nhiên tích tụ (hoặc tập trung)
Ví dụ: Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách sinh viên, tiếp theo chọn ra các lớp điều tra.
5. Chọn mẫu nhiều giai đoạn Trước tiên phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II… Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra các đơn vị mẫu. – Ưu điểm: Có thể áp dụng trong điều tra phạm vi rộng, phân tán, không có được danh sách các đơn vị nghiên cứu; Khung mẫu đơn giản, dễ lập; Điều tra dễ, nhanh vì đối tượng nghiên cứu được nhóm lại; Nâng cao chất lượng giám sát và đảm bảo chất lượng số liệu; Tiết kiệm kinh phí, thời gian. – Nhược điểm: Tính chính xác và đại diện thấp; Cần số chùm/cụm lớn. Phương pháp chọn mẫu phi xác suất:1. Phương pháp chọn mẫu thuận tiện Chọn mẫu dựa trên sự thuận tiện trong lấy mẫu.
2. Phương pháp chọn mẫu theo phán đoán Đây là cách lấy mẫu tùy theo chủ quan phán đoán của nhà nghiên cứu. Chỉ áp dụng khi các đặc tính cùa phần tử được chọn đã khá rõ ràng.
3. Phương pháp chọn mẫu theo định mức Đây là cách giao chỉ tiêu phải phỏng vấn bao nhiêu người trong thời gian qui định.
Ví dụ: Nhà nghiên cứu yêu cầu các vấn viên đi phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố. Ta có chọn dựa theo 2 tiêu thức phân tổ như sau:
Sau đó nhân viên điều tra có thể chọn những người gần nhà hay thuận lợi cho việc điều tra của họ để dễ nhanh chóng hoàn thành công việc. Ở trên là phân bổ theo tiêu thức: độ tuổi và giới tính. Ta có thể sử dụng nhiều tiêu thức hơn. 4. Phương pháp chọn mẫu tích lũy nhanh Bắt đầu từ một phần tử được chọn lọc nào đó. Sau đó nhờ người này giới thiệu hoặc định danh những người khác cùng đặc tính như họ để phỏng vấn tiếp. Áp dụng cho các nghiên cứu khá đặc biệt, mẫu khó tìm hoặc khó tiếp cận. Các phương pháp chọn mẫu
Ở các cách trên, trong chọn mẫu phân tầng, phần tử giữa các tầng có sự khác biệt, trong cùng tầng đồng nhất; trong chọn mẫu theo cụm, phần tử trọng một cụm đa dạng, giữa các cụm ít có sự khác biệt. Trong chọn mẫu theo định mức, nếu nhà nghiên cứu chọn được tiêu chức phân nhóm phù hợp và chọn định mức cho mỗi nhóm phù hợp thì sẽ giống như chọn mẫu phân tầng. Qui trình chọn mẫuChọn mẫu là quá trình chọn lựa một bộ phận tương đối nhỏ từ một tổng thể mang tính đại diện cho tổng thể nghiên cứu bao gồm 5 bước:
|